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Rust 是 一 门 系统 编程 语言 。 

如 今 ， 这 个 定位 需要 稍微 解释 一 下 ， 因 为 现在 大 多 数 以 编程 为 业 的 工程 师 并 不 熟悉 系统 编 
程 。 然 而 只 有 理解 系统 编程 才能 更 好 地 认识 本 书 的 意义 。 

你 合 上 了 自己 的 笔记 本 计算 机 。 你 的 操作 系统 检测 到 这 个 动作 ， 挂 起 所 有 运行 的 程序 ， 关 
闭 显示 器 ， 让 计算 机 进入 休眠 状态 。 过 了 一 会 儿 ， 你 打开 笔记 本 计算 机 ， 屏 幕 和 其 他 应 用 
便 随 之 启动 ， 每 个 程序 都 恢复 到 了 之 前 的 状态 。 我 们 认为 这 是 理所当然 的 ， 但 系统 程序 员 
为 这 一 切 编写 了 很 多 代码 。 

所 谓 系统 编程 ， 指 的 是 编写 : 


。 操作 系统 
。 各 种 设备 驱动 
。 文件 系统 
。 数据 库 
。 运行 在 廉价 设备 或 必须 极端 可 靠 设备 上 的 代码 
。 加 解密 程序 
。 媒体 编 解码 器 〈 读 写 音 频 、 视 频 和 图 片 文件 的 软件 ) 
媒体 处 理 器 (如 语音 识别 或 图 片 编辑 软件 ) 
。 内 存 管理 程序 (如 实现 垃圾 收集 器 ) 
。 文本 泻 染 程序 (将 文本 和 字体 转换 为 像素 ) 
。 高 级 编程 语言 (如 JavaScript 或 Python ) 
。 网 络 程序 
。 虚拟 化 及 软件 容器 
。 科学 模拟 程序 
。 游戏 
简 言 之 ， 系 统 编程 是 一 种 资源 受 限 的 编程 。 这 种 编程 需要 对 每 个 字 节 和 每 个 CPU 时 钟 周 
期 精打细算 。 
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支持 一 个 简单 程序 运行 所 涉及 的 系统 代码 的 数量 是 惊人 的 。 

本 书 不 会 教 你 系统 编程 。 事 实 上 ， 本 书 会 介绍 很 多 内 存 管理 的 细节 ， 如 有 果 疫 有 一 定 的 系统 
编程 经 验 ， 这 些 乍 一 看 有 点 过 于 深奥 。 但 是 ， 如 果 你 是 一 名 资深 系统 程序 员 ， 就 会 发 现 
Rust 有 点 不 可 思议 。 这 门 语言 解决 了 困扰 整个 行业 几 十 年 、 人 所 共 知 的 重要 问题 。 


读者 对 象 


如 果 你 就 是 一 名 系统 程序 员 ， 而 且 在 寻找 C++ 的 替代 品 ， 那 应 该 看 看 本 书 。 如 果 你 是 一 名 
有 其 他 编程 语言 经 验 的 开发 者 ， 无 论 是 C#、Java、Python、JavaScript， 抑 或 别 的 语言 ， 那 
也 应 该 看 看 本 书 。 


不 过 ， 你 不 仅仅 需要 学 习 Rust。 为 了 更 好 地 理解 这 门 语言 ， 你 也 需要 有 一 些 系统 编程 的 经 
验 。 建 议 你 在 阅读 本 书 的 同时 ， 也 用 Rust 写 几 个 系统 编程 的 项 目 。 利 用 Rust 的 速度 、 并 
发 和 安全 ， 构 建 一 些 从 来 没有 构建 过 的 应 用 。 前 面 列 出 的 那个 清单 应 该 能 给 你 一 点 启发 。 


写作 初衷 


我 们 想 写 一 本 自己 当初 学 习 Rust 时 希望 看 的 书 。 我 们 的 目标 是 首先 把 Rust 重要 的 新 概念 
摆 出 来 ， 直 面 问题 ， 然 后 再 把 它们 清晰 、 深 入 地 讲 清 楚 ， 通 过 反复 尝试 降低 学 习 难 度 。 


书 内 容 

本 书 内 容 

本 书 前 两 章 介 绍 Rust 并 提供 了 一 个 简单 教程 ， 第 3 章 讲 解 基本 的 数据 类 型 ， 第 4 章 和 第 5 
章 解释 所 有 权 和 引用 的 核心 概念 。 建 议 大 家 按 顺 序 阅 读 前 5 章 。 

第 6 章 到 第 10 章 讨 论 这 门 语言 的 基础 ， 包 括 表达 式 (第 6 章 )、 错 误 处 理 (第 7 章 )、 包 
和 模块 (第 8 章 )、 结 构 体 (第 9 章 )， 以 及 枚 举 与 模式 (第 10 章 )。 这 些 章节 可 以 跳 着 
读 ， 但 一 定 不 要 跳 过 第 7 章 。 相 信 我 们 。 

第 11 章 介绍 特 型 与 泛 型 ， 这 也 是 你 需要 知道 的 最 后 两 个 主要 概念 。 特 型 类 似 于 Java 或 C# 
中 的 接口 。 它 们 也 是 Rust 支持 的 把 你 的 类 型 集成 到 这 门 语言 本 身 的 主要 方式 。 第 12 章 展 
示 如 何 通过 特 型 实现 操作 符 重 载 ， 第 13 章 介 绍 更 多 的 实用 特 型 。 

理解 特 型 和 泛 型 之 后 就 可 以 陪读 本 书 剩 下 的 内 容 了 。 闭 包 和 进 代 器 是 两 个 不 容错 过 的 强大 
工具 ， 第 14 章 和 第 15 章 分 别 对 它们 进行 了 介绍 。 剩 下 的 所 有 章节 可 以 按 任意 顺序 阅读 ， 
或 者 根据 需要 来 研究 。 这 些 章节 涵盖 了 这 门 语言 的 其 他 部 分 : 集合 (第 16 章 )、 字 符 串 与 
文本 (第 17 章 )、 输 入 和 输出 (第 18 章 )、 并 发 (第 19 章 )、 宏 (第 20 章 ) 以 及 不 安全 
代码 (第 21 章 )。 


排版 约定 


本 书 使 用 以 下 排版 约定 。 






























































口 黑体 





口 等 宽 字 体 (constant w 


表示 新 术语 和 重点 强调 的 内 容 。 


idth ) 


用 于 程序 清单 ， 以 及 在 段落 内 表示 程序 元 素 ， 比 如 变量 或 函数 名 、 数 据 库 、 数 据 类 型 、 
环境 变量 、 语 句 和 关键 字 。 














口 加 粗 等 宽 字体 (constant width bold) 
表示 应 该 由 用 户 输入 的 命令 或 其 他 文本 。 


口 斜体 等 宽 字 体 (constant width italic) 


表示 应 该 使 用 用 户 提供 的 值 或 根据 上 下 文 确定 的 值 来 替换 的 文本 。 






































此 图 标 代表 提示 或 建议 。 


此 图 标 代表 一 般 性 说 明 。 





此 图 标 代表 警告 或 提醒 。 

















使 用 代码 示例 


书 中 示例 的 源 代码 请 到 图 
本 书 是 帮助 你 完成 工作 的 





或 文档 中 使 用 。 除 非 大 量 复制 本 





灵 社 区 本 书 主页 http://ituring.cn/book/2101“ 随 书 下 载 ” 处 下 载 。 





。 一 般 来 说 ， 如 果 代码 示例 是 本 














提供 











的 ， 你 可 以 在 自己 的 程序 





代码 ， 否 则 你 不 需要 联系 我 们 获取 授权 。 例 如 ， 使 用 


本 书 中 的 几 段 代码 编写 一 个 程序 不 需要 获取 授权 。 销 售 或 者 发 布 O'Reilly 图 书 中 代码 的 光 
用 本 书 以 及 示例 代码 来 回答 问题 不 需要 获取 授权 。 将 本 书 中 的 大 





盘 ， 则 需要 获取 授权 。 引 
量 示 例 代 码 整 合 到 你 的 产 





品 文档 中 ， 则 需要 获取 授权 。 





在 使 用 代码 时 ， 我 们 希望 能 标明 出 处 ， 但 并 不 强求 。 出 处 一 般 包括 书 名 、 作 者 、 出 版 商 
和 ISBN。 例 如 ,，“Programming Rust by Jim Blandy and Jason Orendorff (O’Reilly). Copyright 


2018 Jim Blandy and Jason 

















Orendorff 978-1-491-92728-1”。 





如 果 还 有 关于 使 用 代码 的 未 尽 事宜 ， 可 以 随时 与 我 们 联系 : permissions@oreilly.com。 














O'Reilly 在 线 学 习 平台 〈O'Reilly Online Learning) 


OREILLY” 近 40 年 来 ，O’Reilly Media 致力 于 提供 技术 和 商业 培训 、 知 识 和 
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量 文本 和 视频 资源 。 有 关 的 更 多 信息 ， 请 访问 http://oreilly.com。 


联系 我 们 
与 本 书 有 关 的 评论 和 问题 ， 请 发 给 出 版 社 。 
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O’Reilly Media, Inc. 
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Mozilla 对 我 们 在 这 个 项 目 上 的 工作 极为 包容 ， 即 使 这 件 事 并 非 我 们 工作 职责 所 在 ， 而 上 且 
还 会 占用 一 部 分 工作 时 间 。 非 常 感谢 Dave Camp、Naveed Ihsanullah、Tom Tromey 和 Joe 
Walker 这 几 位 领导 的 支持 。 他 们 都 在 为 Mozilla 的 长 远 着 想 ， 我 们 希望 这 份 成 果 能 够 达到 
他 们 的 期 望 。 


我 们 还 想 表 达 对 O’Reilly 每 一 位 编辑 的 感激 之 情 ， 是 他 们 让 这 个 项 目 得 以 开花 结果 ， 尤 其 
要 感激 Brian MacDonald 和 Jeff Bleiel。 


最 重要 的 是 ， 瑞 心 感谢 我 们 的 妻子 和 孩子 ， 感 谢 他 们 坚定 不 移 的 爱 、 热 情 和 耐心 。 


电子 书 


扫描 如 下 二 维 码 ， 即 可 购买 本 书 中 文 版 电子 版 。 


[ml] ther [e] 
: 2 
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为 什么 是 Rust 


在 某 些 场景 ， 比 如 Rust 的 应 用 场景 下 ， 速 度 是 竞 品 的 10 倍 ， 哪 怕 只 是 两 信和 都 是 


到 生死 存亡 的 大 问题 。 速 度 决 定 了 这 套 系统 在 市 场 上 的 命运 ， 跟 硬件 市 场 丝 


毫 不 差 。 





Graydon Hoare 


如 今 ， 所 有 计算 机 都 是 并 行 的 ……… 并 行 编程 就 是 编程 。 





Structured Parallel Programming, Michael McCool 等 


TrueType 解析 器 的 缺陷 被 攻击 者 利用 ， 以 达到 监视 目的 ; 所 有 软件 都 涉及 安全 。 


一 一 Andy Wingo 


从 开始 使 用 高 级 语言 编写 操作 系统 至 今 的 50 多 年 来 ， 系 统 编程 语言 已 经 取得 了 长 足 的 进 


步 。 然 而 ， 有 两 个 问题 至 今 仍 无 法 破解 。 














要 写 出 安全 的 代码 并 不 容易 。 想 用 C 和 C++ 恰当 地 管理 好 内 存 特 别 困难 。 几 十 年 来 ， 
用 户 已 经 饱 受 安全 漏洞 的 侵害 ， 至 少 可 以 追溯 到 1988 年 的 Morris 蠕虫 病毒 。 

编写 多 线程 代码 非常 困难 ， 而 多 线程 又 是 充分 利用 现代 计算 机 能 力 的 唯一 方式 。 即 便 是 
经 验 丰 富 的 程序 员 ， 在 应 对 与 线程 有 关 的 代码 时 也 必须 多 加 留心 ， 因 为 并 发 会 导致 各 式 
各 样 的 新 bug， 还 会 让 普通 的 bug 难以 复 现 。 





下 面 介绍 一 种 具有 C 和 C++ 性 能 ， 同 时 安全 且 支 持 并 发 的 语言 





























Rust。 





Rust 是 由 Mozilla 和 社区 贡献 者 共同 开发 的 一 种 新 的 系统 编程 语言 。 与 C 和 C++ 类 似 ， 
Rust 为 开发 者 使 用 内 存 提供 了 完善 的 控制 机 制 ， 在 语言 的 原始 操作 与 运行 它 的 机 器 的 操 
作 之 间 维 护 着 一 种 紧密 的 关系 ， 让 开发 者 能 够 预测 自己 代码 的 运行 成 本 。Rust 承载 着 











C++ 之 父 Bjarne Stroustrup 在 他 的 论文 “Abstraction and the C++ Machine Model” 中 明确 
提出 的 理想 : 


总 的 来 说 ，C++ 实现 遵循 零 开 销 原则 : 不 用 的 ， 不 必 为 之 付出 代价 ; 要 用 的 ， 也 
不 会 有 代码 比 它 更 好 。 


在 此 基础 之 上 ，Rust 又 追加 了 自己 内 存 安 全 和 可 靠 并 发 的 目标 。 


Rust 实现 上 述 所 有 承诺 的 关键 在 于 所 有 权 (ownership)、 转 移 (move) 和 借用 (borrow ) 
机 制造 就 的 新 型 系统 ， 而 编译 时 检查 和 认真 的 设计 又 成 就 了 Rust 灵活 的 静态 类 型 系统 。 所 
有 权 机 制 为 每 个 值 规划 了 清晰 的 生命 期 ， 从 而 让 核心 语言 不 再 需要 垃圾 收集 ， 同 时 还 为 管 
理 套 接口 (socket) 和 文件 勾 柄 (handle)，' 等 资源 提供 了 可 靠 而 又 灵活 的 接口 。 转 移 把 值 从 
一 个 所 有 者 转移 给 另 一 个 所 有 者 ， 而 借用 让 代码 可 以 临时 使 用 某 个 值 ， 同 时 又 不 影响 其 所 
有 权 。 考 虑 到 很 多 程序 员 之 前 从 未 碰 到 过 此 类 特性 的 这 种 形式 ， 第 4 章 和 第 5 章 将 对 它们 
进行 详尽 的 介绍 。 

同样 的 所 有 权 规 则 也 是 Rust 值得 依赖 的 并 发 模型 的 基础 。 说 到 互 斥 量 (mutex) 与 其 所 要 
保护 数据 的 关系 ， 大 多 数 语言 是 靠 注释 解决 问题 的 。 而 Rust 通过 编译 时 检查 可 以 发 现 访问 
被 锁 住 的 互 斥 量 的 问题 。 大 多 数 语言 只 会 告诫 开发 者 要 确保 不 访问 已 经 交 给 其 他 线程 的 数 
据 ，Rust 却 能 通过 检查 保证 你 没有 那么 做 。Rust 能 够 在 编译 时 防止 数据 争 用 。 

Rust 并 非 真 正 的 面向 对 象 语言 ， 它 只 是 具有 一 些 面向 对 象 的 特征 而 已 。Rust 也 不 是 函数 式 
语言 ， 虽 然 它 可 以 像 函 数 式 语言 那样 让 计算 结果 更 容易 推断 。Rust 在 某 种 程度 上 类 似 于 C 
和 C++, 但 C 和 C++ 的 很 多 惯用 语法 不 能 照搬 过 来 在 Rust 中 使 用 ， 所 以 典型 的 Rust 代码 
说 到 底 还 是 不 像 C 或 C++ 代码 。 关 于 Rust 到 底 是 哪 种 语言 ， 最 好 还 是 等 你 熟悉 它 之 后 ， 
自己 来 下 结论 吧 。 


为 了 通过 真正 的 项 目 获 得 关于 设计 的 反馈 ，Mozilla 用 Rust 开发 了 Servo， 这 是 一 个 新 的 
Web 浏览 器 引擎 。Servo 的 需求 与 Rust 的 目标 完美 匹配 : 浏览 器 必须 高 性 能 ， 还 要 能 安全 
地 处 理 不 受信 的 数据 。Servo 利用 Rust 的 安全 并 发 最 大 限度 地 挖掘 机 器 潜力 ， 在 某 些 任 务 
上 实现 了 C 或 C++ 不 可 能 实现 的 并 行 处 理 。Servo 与 Rust 一 直 并 肩 成 长 ，Servo 不 断 应 用 
Rust 的 最 新 语言 特性 ，Rust 也 基于 Servo 开发 者 的 反馈 不 断 改进 。 


hI Pa ry 
类 型 安全 
Rust 是 类 型 安全 的 语言 ， 那 么 “类 型 安全 ” 指 的 是 什么 ”安全 听 起 来 不 错 ， 但 要 从 哪里 做 
起 呢 ? 
以 下 是 C99， 也 就 是 C 编程 语言 1999 年 标准 中 对 未 定义 行为 的 定义 : 
未 定义 行为 
由 于 使 用 不 可 移植 或 错误 的 程序 构造 ， 或 者 使 用 错误 的 数据 导致 的 行为 ， 本 国际 
标准 对 此 不 作 要 求 。 






























































注 1: 大 多 数 人 习惯 于 将 handle 翻译 为 “句柄 ”， 但 “ 勾 柄 ” 才 是 正确 的 。 一 一 译 者 注 
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来 看 下 面 的 C 程序 : 


int main(int argc, char **argv) { 
unsigned long a[1]; 
a[3] = Ox7ffff7b36cebUL; 
return 0; 


} 


根据 C99， 因 为 这 段 程序 访问 的 元 素 超出 了 数组 a 的 边界 ， 所 以 它 的 行为 是 未 定义 的 。 换 
句 话说， 执行 这 段 代 码 可 以 出 现任 何 结果 。 当 我 们 在 Jim 的 笔记 本 计算 机 上 运行 这 段 程序 
时 ， 看 到 了 以 下 输出 : 


undef: Error: .netrc file is readable by others. 
undef: Remove password or make file unreadable by others. 


然后 程序 就 崩溃 了 。Jim 的 笔记 本 计算 机 上 根本 就 没有 一 个 叫 .netrc 的 文件 。 如 果 你 在 自 
己 的 计算 机 上 运行 这 段 代 码 ， 很 可 能 结果 又 不 一 样 。 
C 编译 器 为 这 个 main 函数 生成 的 机 器 码 恰好 把 数组 3 保存 到 返回 地 址 前 面 3 个 字 的 位 置 ， 
因此 把 6x7ffff7b36cebuL 保存 到 a[3] ， 会 把 main 的 返回 地 址 改 为 指向 C 标准 库 中 一 段 代 
码 的 中 间 ， 该 代码 会 从 某 人 的 .netrc 文件 中 读 取 密 码 。 在 main 返回 时 ， 执 行 并 没有 恢复 到 
main 的 调用 者 ， 而 是 转 到 了 库 中 以 下 几 行 代码 的 机 器 码 : 

warnx(_("Error: .netrc file is readable by others.")); 


warnx(_("Remove password or make file unreadable by others.")); 
goto bad; 


C 编译 器 允许 数组 引用 影响 后 续 return 语句 的 行为 是 完全 符合 标准 的 。 未 定义 操作 并 非 只 
产生 意 想 不 到 的 结果 ， 事 实 上 这 种 情况 下 程序 无 论 做 任何 事情 都 是 被 允许 的 。 


为 了 生成 更 快 的 代码 ，C99 授予 编译 器 全 权 。 这 个 标准 没有 让 编译 器 负责 检测 和 处 理 可 疑 
的 行为 《比如 数组 越界 )， 而 是 让 程序 员 负 责 保证 这 种 情况 永远 不 会 发 生 。 

从 经 验 来 看 ， 人 类 在 这 方面 并 不 擅长 。 在 犹他 大 学 读书 时 ， 研 究 员 李 朋 (Peng Li) 修改 
了 C 和 C++ 编译 器 ， 让 它们 编译 后 的 程序 可 以 在 执行 某 种 形式 的 未 定义 行为 时 发 送 报告 。 
他 发 现 几乎 所 有 程序 都 会 发 送 报告 ， 包 括 那 些 高 标准 严 要 求 的 备 受 推 党 的 项 目 。 实 践 中 ， 
未 定义 行为 经 常会 导致 可 被 利用 的 安全 漏洞 。Morris 蠕虫 病毒 就 是 利用 前 面 代码 的 原理 
并 经 过 精心 改造 ， 将 自己 复制 到 不 同 机 器 的 。 而 基于 同样 原理 的 漏洞 利用 在 今天 仍然 广 
泛 存在 。 
基于 这 个 例子 ， 可 以 定义 几 个 术语 。 如 有 果 将 一 个 程序 写 得 不 可 能 在 执行 时 导致 未 定义 行 
为 ， 那 么 就 称 这 个 程序 为 定义 良好 的 (well defined)。 如 果 一 种 语言 的 安全 检查 可 以 保证 
所 有 程序 都 定义 良好 ， 那 么 就 称 这 种 语言 是 类 型 安全 的 。 

如 果 足 够 用 心 ， 用 C 或 C++ 应 该 也 能 写 出 定义 良好 的 程序 ， 但 C 和 C++ 不 是 类 型 安全 
的 : 前 面 的 程序 中 没有 类 型 错误 ， 但 出 现 了 未 定义 行为 。 相 对 而 言 ，Python 是 类 型 安全 
的 。Python 乐意 花 处 理 器 时 间 来 检查 和 处 理 数组 索引 越界 的 操作 ， 方 式 也 比 C 更 友好 : 


>>> a = [0] 
>>> a[3] = Ox7ffff7b36ceb 
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Traceback (most recent call last): 

File "<stdin>", line 1, in <module> 
IndexError: list assignment index out of range 
>>> 


Python 抛 出 了 异常 ， 这 不 是 未 定义 行为 : Python 文档 指出 ，a[3] 这 种 赋值 应 该 抛 出 
IndexError 异常 (我们 也 看 到 了 )。 当 然 ，ctypes 之 类 提供 对 机 器 无 约束 访问 的 模块 
可 能 会 在 Python 代码 中 引入 未 定义 行为 ， 但 其 核心 语言 本 身 还 是 类 型 安全 的 。Java、 
JavaScript、Ruby 和 Haskell 在 这 方面 都 类 似 。 


注意 ， 类 型 安全 与 一 门 语言 是 在 编译 时 还 是 在 运行 时 检查 类 型 无 关 。C 在 编译 时 检查 ， 但 
它 不 是 类 型 安全 的 ，Python 在 运行 时 检查 ， 但 它 是 类 型 安全 的 。 


说 起 来 还 真有 点 尴 众 ， 占 有 统治 地 位 的 系统 编程 语言 C 和 C++ 都 不 是 类 型 安全 的 ， 大 多 
数 其 他 流行 的 语言 则 是 类 型 安全 的 。 考 虑 到 设计 C 和 C++ 的 初衷 就 是 用 它们 去 实现 系统 
的 基础 部 分 、 实 现 可 靠 的 安全 隔离 ， 以 及 操作 不 可 信 数 据 ， 类 型 安全 对 它们 而 言 好 像 恰 恰 
是 最 有 价值 的 特性 才 对 。 


Rust 要 解决 的 正 是 这 个 沉淀 了 几 十 年 的 老 问 题 : 它 既 是 类 型 安全 的 ， 又 是 一 种 系统 编程 语 
言 。Rust 的 设计 初 囊 也 是 用 于 实现 那些 要 求 高 性 能 和 对 资源 精细 控制 的 基础 系统 层 ， 同 时 
还 能 基于 类 型 安全 提供 最 基本 的 可 预测 性 。 本 书后 面 的 章节 将 详细 介绍 Rust 是 如 何 做 到 这 
个 统一 的 。 


对 多 线程 编程 而 言 ，Rust 特定 形式 的 类 型 安全 有 着 令 人 意 想 不 到 的 影响 。 众 所 周知 ， 正 确 
实现 并 发 在 C 和 C++ 中 非常 困难 。 开 发 者 通常 仅 在 单线 程 实在 无 法 满足 性 能 要 求 时 才 会 
考虑 并 发 。 但 Rust 可 以 通过 编译 时 检查 保证 并 发 不 会 发 生 数据 争 用 ， 并 会 捕获 任何 对 互 
斥 量 或 者 其 他 同步 原 语 (synchronization primitive) 的 错误 使 用 。 使 用 Rust 编写 并 发 程序 ， 
你 再 也 不 用 担心 自己 的 代码 只 有 经 验 非 常 丰富 的 程序 员 才 能 看 懂 了 。 


Rust 的 安全 规则 也 有 一 个 “逃生 阀 "， 用 于 必须 使 用 原始 指针 的 情形 。 这 种 情况 下 你 写 的 
是 不 安全 代码 ， 虽 然 绝 大 多 数 Rust 程序 用 不 到 ， 但 第 21 章 也 会 介绍 如 何 使 用 它 以 及 它 在 
整个 Rust 安全 蓝图 中 的 位 置 。 


与 其 他 静态 类 型 的 语言 相似 ，Rust 的 类 型 除了 可 以 防止 未 定义 行为 ， 还 有 很 多 优点 。 经 
验 丰 富 的 Rust 程序 员 利 用 类 型 不 仅 可 以 保证 安全 地 使 用 数据 ， 也 可 以 保证 有 意义 地 使 用 
数据 ， 即 与 应 用 的 意图 保持 一 致 。 特 别 地 ， 第 11 章 讨论 的 Rust 的 特 型 (trait) 和 泛 型 
(generic) ， 为 描述 一 组 类 型 的 共性 ， 乃 至 进一步 利用 这 些 共性 提供 了 简洁 、 灵 活 且 高 效 的 
手段 。 

本 书 的 宗旨 不 仅 是 教会 你 如 何 用 Rust 编写 程序 ， 更 重要 的 是 要 教会 你 如 何 利用 这 门 语 言 写 
出 安全 又 得 体 的 程序 ， 同 时 还 能 够 预测 程序 的 执行 。 在 我 们 看 来 ，Rust 应 该 是 系统 编程 发 
展 史上 的 一 个 巨大 进步 ， 本 书 就 是 要 帮 你 学 会 使 用 它 。 
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Rust 初 体验 





一 个 人 的 经 验 完全 建构 在 他 的 语言 之 上 。 





Henri Delacroix (法 国 心理 学 家 ) 


本 章 将 通过 几 个 小 程序 来 展示 Rust 的 语法 、 类 型 及 语义 ， 看 看 它们 是 如 何 支持 安全 、 并 
发 和 高 效 代 码 的 。 我 们 会 从 下 载 、 安 装 Rust 开始 ， 然 后 看 一 个 数学 相关 的 小 例子 ， 接 
下 来 尝试 基于 第 三 方 库 写 一 个 Web 服务 器 ， 最 后 再 使 用 多 线程 加 速 绘 制 曼 德 布 阁 特 
(Mandelbrot) 集合 的 过 程 。 


2.1 下 载 和 安装 Rust 


安装 Rust 的 最 佳 方法 是 使 用 rustup， 也 就 是 Rust 安装 器 。 打 开 rustup.rs 网 站 ， 然 后 按照 
上 面 的 指示 操作 即 可 。 


此 外 ， 也 可 以 打开 Rust 官方 网 站 ， 点 击 Install， 在 Other installation methods (其 他 安装 
方法 ) 中 找到 针对 Linux、macOS 和 Windows 的 单独 安装 包 。 某 些 操作 系统 中 也 可 能 

经 自 带 了 Rust。 但 还 是 推荐 大 家 使 用 rustup 来 安装 ， 因 为 它 是 一 个 管理 Rust 安装 包 的 工 
有 具 ， 类 似 Ruby 的 RVM 或 者 Node 的 NVM。 这 样 在 遇 到 Rust 有 新 版 本 发 布 时 ， 只 要 运行 
rustup update 即 可 升级 到 新 版 本 。 


不 管 怎样 ， 安 装 完 成 后 ， 都 应 该 可 以 在 命令 行 中 使 用 3 个 新 命令 : 


$ cargo --version 

cargo 1.34.0 (6789d8a0a 2019-04-01) 
$ rustc --version 

rustc 1.34.1 (fc50f328b 2019-04-24) 
$ rustdoc --version 

rustdoc 1.34.1 (fc50f328b 2019-04-24) 
$ 
























































这 里 的 $ 是 命令 提示 符 ， 在 Windows 上 它 应 该 是 C:\> 或 类 似 的 东西 。 上 面 的 代码 中 运行 

了 我 们 安装 的 3 个 命令 ， 分 别 输出 了 它们 的 版 本 号 。 下 面 分 别 介绍 一 下 这 几 个 命令 。 

。 cargo 是 Rust 的 编译 管理 器 、 包 管理 器 以 及 通用 工具 。 可 以 使 用 Cargo 来 创建 新 项 目 、 
构建 和 运行 程序 ， 以 及 管理 代码 所 依赖 的 外 部 库 。 

。 rustc 是 Rust 编译 器 。 通 常 是 通过 Cargo 来 调用 编译 器 ， 但 有 时 候 也 需要 直接 调用 它 。 

。 rustdoc 是 Rust 文档 工具 。 如 果 在 代码 注释 中 以 适当 格式 写 了 文档 ， 那 么 rustdoc 可 以 
基于 它们 生成 格式 化 的 HIML。 与 rustc 类 似 ， 通 常 也 让 Cargo 来 帮助 运行 rustdoc。 


为 方便 起 见 ，Cargo 也 可 以 帮 有 我 们 创建 新 的 Rust 包 ， 并 适当 写 入 一 些 标准 的 元 数据 : 


$ cargo new --bin hello 
Created binary (application) “heLLo ”project 


这 个 命令 会 创建 一 个 新 的 包 目录 hello， 其 中 - -bin 标记 告诉 Cargo 将 其 作为 一 个 可 执行 文 
件 ， 而 不 是 一 个 库 。 下 面 看 看 这 个 包 的 顶级 目录 下 都 有 什么 : 


$ cd hello 
$ Ls -la 
total 24 
drwxrwxr-x. 
























































4 jimb jimb 4096 Sep 22 21:09 . 

2 jimb jimb 4096 Sep 22 21:09 .. 
drwxrwxr-x. 6 jimb jimb 4096 Sep 22 21:09 .git 
-rw-rw-r--. 1 jimb jimb 7 Sep 22 21:09 .gitignore 
-rw-rw-r--. 1 jimb jimb 88 Sep 22 21:09 Cargo.toml 
drwxrwxr-x. 2 jimb jimb 4096 Sep 22 21:09 src 
$ 


可 以 看 到 ，Cargo 创建 了 一 个 名 为 Cargo.toml 的 文件 ， 用 于 保存 这 个 包 的 元 数据 。 此 时 文 
件 内 容 不 多 : 


[package] 

name = "hello" 

version = "0.1.0" 

authors = ["You <you@example.com"] 
edition = "2018" 





[dependencies] 
如 果 程 序 依赖 其 他 库 ， 那 么 可 以 把 它们 列 在 这 个 文件 里 ，Cargo 将 负责 下 载 、 构 建 和 更 新 
这 些 库 。 关 于 Cargo.toml 的 配置 ， 第 8 章 将 详细 介绍 。 
Cargo 刚刚 创建 了 一 个 自 带 Git 版 本 控制 系统 的 包 ，.git 子 目录 中 包含 着 元 数据 ， 还 有 一 
个 .gitignore 文件 。 如 果 不 需 要 Cargo 这 么 做 ， 那 么 可 以 在 命令 行 里 加 上 - -cvs none 标记 。 
src 子 目录 中 包含 了 真正 的 Rust 代码 : 


$ cd src 
$1ls-l 
total 4 
-rw-rw-r--. 1 jimb jimb 45 Sep 22 21:09 main.rs 


看 起 来 好 像 Cargo 已 经 替 我 们 写 好 程序 了 。main.rs 文件 中 包含 以 下 内 容 : 











fn main() { 
println!("Hello, world!"); 
} 


看 见 了 吗 ， 使 用 Rust 你 甚至 不 用 自己 写 “Hello, world!” 程 序 。 应 该 说 ， 这 就 是 一 个 新 
Rust 程序 的 样板 : 两 个 文件 ， 总 共 10 行 代码 。 


在 这 个 包 的 任何 目录 调用 cargo run 命令 都 可 以 构建 并 运行 这 个 程序 : 


$ cargo run 
Compiling hello vO.1.0 (file:///home/jimb/rust/hello) 
Finished dev [unoptimized + debuginfo] target(s) in 0.27 secs 
Running `/home/jimb/rust/hello/target/debug/hello. 
Hello, world! 
$ 


这 里 ，Cargo 调用 了 Rust 编译 器 rustc， 然 后 义 运 行 了 生成 的 可 执行 文件 。Cargo 把 可 执行 
文件 放 到 了 包 顶 部 的 target 子 目 录 中 : 


$ ls -L ../target/debug 











total 580 

drwxrwxr-x. 2 jimb jimb ©4096 Sep 22 21:37 build 
drwxrwxr-x. 2 jimb jimb ©4096 Sep 22 21:37 deps 
drwxrwxr-x. 2 jimb jimb ©4096 Sep 22 21:37 examples 
-rwxrwxr-x. 1 jimb jimb 576632 Sep 22 21:37 hello 
-rw-rw-r--. 1 jimb jimb 198 Sep 22 21:37 hello.d 
drwxrwxr-x. 2 jimb jimb 68 Sep 22 21:37 incremental 


drwxrwxr-x. 2 jimb jimb © 4096 Sep 22 21:37 native 
$ ../target/debug/hello 

Hello, world! 

$ 


最 后 ， 可 以 让 Cargo 清理 生成 的 文件 : 


$ cargo clean 

$ ../target/debug/hello 

bash: ../target/debug/hello: No such file or directory 
$ 


2.2 一 个 简单 的 函数 


Rust 的 语法 有 意 模仿 了 现 有 语言 。 如 果 你 熟悉 C、C++、Java 或 JavaScript， 那 自然 就 可 以 
看 懂 Rust 程序 的 结构 。 下 面 是 一 个 用 于 计算 两 个 整数 的 最 大 公约 数 的 函数 ， 其 使 用 的 是 欧 
几 里 得 算法 ; 

fn gcd(mut Nn: u64，mut m: 464) -> 464 { 


assert!(n != 0 && m != 0); 
while m != 0 { 




















ifm<nt 
Let t= m; 
m= n; 
n = 七 ; 

} 
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关键 字 fn (发 音 为 [fn]) 定义 了 一 个 名 为 gcd (greatest common divisor， 最 大 公约 数 ) 的 
国 数 ， 甚 接收 两 个 参数 n 和 m， 类 型 均 为 u64， 即 无 符号 (unsigned) 64 位 (bit) 整数 。 符 
号 -> 后 面 是 返回 值 类 型 ， 这 里 同样 也 返回 u64 值 。4 个 空格 的 缩 进 是 Rust 风格 。 


Rust 的 机 器 整数 类 型 名 反映 了 它们 的 大 小 及 有 无 符号 ， 比 如 i32 表示 有 符号 32 位 整数 ， 
u8 表示 无 符号 8 位 整数 (用 于 “ 字 节 ” 值 )。isize 和 usize 分 别 表示 指针 大 小 的 有 符号 和 
无 符号 整数 ， 在 32 位 平台 是 32 位 ， 在 64 位 平台 则 为 64 位 。Rust 还 有 两 个 浮 点 类 型 f32 
和 f64， 分 别 是 IEEE 单 精度 和 双 精 度 浮 点 类 型 ， 类似 C 和 C++ 的 float 和 double。 

默认 情况 下 ， 一 个 变量 被 初始 化 之 后 ， 它 的 值 就 不 能 变 了 。 但 是 ， 像 前 面 那样 在 参数 n 和 
m 前 加 上 mut (发 音 为 [mjut]， 是 mutable 的 简写 ) 关键 字 ， 则 表示 可 以 在 函数 体内 给 它们 赋 
值 。 实 践 中 ， 大 多 数 变 量 不 会 被 赋值 ， 此 时 加 上 mut 关键 字 可 以 给 阅读 代码 的 人 一 个 提醒 。 


函数 体 的 第 一 行 代码 调用 了 assert! 宏 ， 用 于 验证 参数 的 值 都 不 等 于 0。! 符号 表示 这 是 
一 个 宏 调 用 ,不 是 函数 调用 。 与 C 和 C++ 中 的 assert 宏 类 似 ，Rust 中 的 assert! 宏 会 检 
查 自 己 的 参数 是 不 是 true， 如 果 不 是 ， 则 终止 程序 并 输出 相关 信息 ， 包 含 检查 失败 的 代码 
在 源 代码 中 的 位 置 。 这 种 突然 的 终止 在 Rust 中 叫 证 异 (panic)。 与 C 和 C++ 中 的 断言 可 
以 跳 过 不 同 ，Rust 不 管 程序 是 如 何 编译 的 都 会 检查 断言 。 不 过 也 有 一 个 debug_assert! 宏 ， 
它 会 在 程序 为 速度 而 编译 时 被 跳 过 。 

我 们 的 函数 的 核心 是 一 个 while 循环 ， 其 中 又 包含 一 个 if 语句 和 一 个 赋值 。 与 C 和 C++ 不 
同 ，Rust 不 需要 用 圆 括 号 来 括 住 条 件 表达 式 ， 但 需要 用 花 括号 括 住 条 件 满足 后 要 执行 的 语句 。 


let 语句 用 于 声明 一 个 局 部 变量 ， 比 如 函数 中 的 t。 这 里 不 用 明确 写 出 t 的 类 型 ,因为 
Rust 可 以 根据 如 何 使 用 变量 推断 出 来 。 在 这 个 函数 中 ， 唯 一 适合 t 的 类 型 是 u64， 也 就 是 
m 和 n 的 类 型 。Rust 只 在 函数 体内 推断 变量 类 型 ， 函 数 参数 和 返回 值 则 必须 像 前 面 一 样 明 
确 写 出 类 型 。 假 如 要 写 出 t 的 类 型 ， 则 可 以 这 样 写 : 


let t: uy64 = m; 


Rust 有 return 语句 ， 但 gcd 函数 中 没有 。 如 果 函 数 体 中 最 后 一 行 代码 是 一 个 表达 式 ， 且 表 
达 式 末尾 没有 分 号 ， 那 这 个 表达 式 的 值 就 是 函数 的 返回 值 。 实 际 上 ， 用 花 括号 括 起 来 的 任 
何 代码 块 都 可 以 看 作 一 个 表达 式 。 比 如 ， 下 面 这 个 代码 块 就 是 一 个 打印 一 条 消息 之 后 又 返 
回 x.cos() 值 的 表达 式 : 



























































println!("evaluating cos x"); 
x.cos() 


这 种 在 控制 流 “ 离 开 函数 末尾 ”时 生成 函数 值 的 方式 是 Rust 特有 的 。return 语句 一 般 只 
用 于 在 函数 的 中 间 提 前 返回 。 





b= 





2.3 ”编写 和 运行 单元 测试 
Rust 语言 本 身 内 办 了 简单 测试 机 制 。 要 测试 gcd 函数 ， 可 以 这 样 写 ， 


#[test] 
fn test gcd() { 
assert_ eq!(gcd(14, 15), 1); 








assert eq!(gcd(2 * 3*5* 11 * 17， 
3 了 了 尖 4 半 -3 区 19)， 
3. * 11); 
} 
这 里 定义 了 一 个 名 为 test_gcd 的 函数 ， 它 会 调用 gcd 并 检查 其 是 否 返 回 了 正确 的 值 。 
数 定义 上 方 的 #test] 表示 test_gcd 是 一 个 测试 函数 ， 在 和 常规 编译 中 会 被 跳 过 ， 但 在 通 
cargo _ test 命令 运行 程序 时 会 包含 并 自动 调用 。 假 设 我 们 修改 了 本 章 开 始 时 创建 的 hello 
包 ， 加 入 了 gcd 和 test_gcd 的 代码 。 如 果 当 前 目录 是 这 个 包 中 的 任意 目录 ， 则 可 以 像 下 面 
这 样 运行 测试 : 
$ cargo test 
Compiling hello vO.1.0 (file:///home/jimb/rust/hello) 


Finished dev [unoptimized + debuginfo] target(s) in 0.35 secs 
Running /home/jimb/rust/hello/target/debug/deps/hello-2375a82d9e9673d7 

















running 1 test 
test test gcd ... ok 


test result: ok. 1 passed; 0 failed; 0 ignored; 0 measured 
$ 


测试 函数 可 以 写 在 源 代码 中 的 任何 地 方 ， 只 要 紧 跟 着 它 要 测试 的 代码 即 可 。 这 样 ，cargo 
test 会 自动 把 它们 收集 起 来 并 全 部 运行 。 

#[test] 标记 是 属性 (attripute) 的 一 个 例子 。 属 性 是 一 种 开放 式 标 记 机 制 ， 用 于 给 函数 或 
其 他 声明 添加 补充 说 明 ， 就 像 C++ 和 C# 中 的 属性 和 Java 中 的 注解 一 样 。 属 性 可 以 用 于 
控制 编译 器 报警 和 代码 风格 检查 、 有 条 件 地 包含 代码 (比如 C 和 C+t+ 中 的 大 fdef)、 告 诉 
Rust 如 何 与 其 他 语言 的 代码 互 操作 ， 等 等 。 本 书后 面 还 会 介绍 更 多 属性 的 例子 。 


2.4 ”处 理 命令 行 参数 


如 果 想 通过 命令 行 参数 接收 一 系列 数值 ， 然 后 打印 出 它们 的 最 大 公约 数 ， 那 么 可 以 将 main 
国 数 改写 成 下 面 这 样 : 


use std::io::Write; 
use std::str::FromStr; 









































fn main() { 
Let mut numbers = Vec::new(); 
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for arg in std::env::args().skip(1) { 
numbers.push(u64: :from_str(&arg) 
.expect("error parsing argument")); 


} 


if numbers.len() == 0 { 
writeln!(std::io::stderr(), "Usage: gcd NUMBER ...").unwrap(); 
std: :process: :exit(1); 


} 


let mut d = numbers[0]; 

for m in &numbers[1..] { 
d = gcd(d, *m); 

} 


println!("The greatest common divisor of {:?} is {}", 
numbers, d); 


上 
代码 不 少 ， 我 们 拆 开 来 看 : 
use std::io::Write; 
use std::str::FromStr; 
use 声明 向 当前 作用 域 引 入 了 两 个 特 型 (trait) : Write 和 FromStr。 第 11 章 将 详细 介绍 特 
型 ， 在 此 只 要 简单 地 把 它们 理解 为 某 种 类 型 可 以 实现 的 一 组 方法 就 行 了 。 虽 然 程序 中 没有 
用 到 write 或 Fromstr 这 两 个 名 字 ， 但 用 到 了 它们 的 方法 ， 为 此 相关 的 特 型 必须 出 现在 作 
用 域 中 。 对 当前 的 例子 而 言 ， 有 下 面 两 种 情况 。 
。 任何 实现 Write 特 型 的 类 型 都 有 用 于 将 格式 化 文本 写 入 输出 流 的 write_fmt 方法 。 
std::io::Stderr 类 型 实现 了 Write， 而 我 们 要 使 用 writeln! 宏 来 打印 错误 消息 ， 这 个 
宏 展 开 之 后 的 代码 要 使 用 write_fmt 方法 。 
。 任何 实现 Fromstr 特 型 的 类 型 都 有 用 于 从 字符 串 解 析出 该 类 型 值 的 from_str 方法 。u64 
类 型 实现 了 Fromstr， 而 我 们 会 调用 u64: :from_str 来 解析 命令 行 参数 。 
回 到 程序 的 main 函数 : 
fn main() { 
这 个 main 函数 不 返回 值 ， 因 此 可 以 省 略 通 常 要 写 在 参数 列表 后 面 的 -> 和 返回 值 类 型 声明 。 
Let mut numbers = Vec::new(); 
在 函数 体内 声明 一 个 可 修改 局 部 变量 numbers， 并 将 其 值 初始 化 为 一 个 空 向 量 (vector)。Vec 
是 Rust 中 可 扩展 的 向 量 类 型 ， 类 似 C++ 中 的 std: :vector、Python 中 的 列表 或 JavaScript 中 
的 数组 。 尽 管 向 量 是 可 扩展 和 收缩 的 ， 但 要 癌 向 量 末尾 推 和 人 数值 ，Rust 还 要 求 必须 给 变量 
加 上 mut 标记 。 
numbers 的 类 型 是 Vec<u64>， 即 一 个 包含 u64 值 的 向 量 。 但 跟 以 前 一 样 ， 这 里 不 需要 明确 
写 出 来 。Rust 会 帮 有 我 们 推断 它 的 类 型 ， 一 方面 我 们 推 到 向 量 里 的 是 u64 值 ， 另 一 方面 我 们 
传 给 gcd 函数 的 是 向 量 的 元 素 ， 而 gcd 只 接收 u64 值 。 
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for arg in std::env::args().skip(1) { 
接 下 来 使 用 for 循环 处 理 命令 行 参数 ， 依 次 将 每 个 参数 赋值 给 变量 arg 并 运行 循环 体 。 


std::env::args 国 数 返 回 一 个 迭代 器 (iterator)， 而 迭代 器 会 按 需 生成 每 一 个 参数 ， 并 在 没 
有 更 多 参数 时 指出 来 。 迭 代 器 在 Rust 中 极其 常用 ， 标 准 库 中 也 包含 多 种 迭代 器 ， 比 如 迭代 
向 量 元 素 的 、 和 迭代 文件 的 每 一 行 的 、 和 迭代 收 到 的 每 条 消息 的 ， 总 之 ， 可 以 通过 循环 处 理 的 
任何 数据 都 有 对 应 的 迭代 器 。Rust 的 迭代 器 效率 很 高 ， 编 译 器 通常 可 以 把 它们 转换 成 跟 手 
写 循环 一 样 的 代码 。 第 15 章 将 讨论 迭代 器 的 原理 和 相应 的 例子 。 


除了 与 for 循环 配合 使 用 ， 和 迭代 器 本 身 也 提供 了 很 多 能 直接 使 用 的 方法 。 比 如 ，std:: 
env::args 返回 的 迭代 器 的 第 一 个 值 始终 是 当前 运行 的 程序 的 名 字 。 我 们 想 跳 过 这 个 值 ， 
因此 可 以 调用 迭代 器 的 skip 方法 ， 从 而 生成 一 个 不 包含 第 一 个 值 的 新 迭代 器 。 


numbers.push(u64: :from_str(&arg) 
.expect("error parsing argument")); 


接 下 来 调用 u64: :from_str， 尝 试 从 命令 行 参数 arg 中 解析 出 一 个 无 符号 64 位 整数 。 注 意 ， 
u64: :from_str 并 不 是 我 们 获取 的 某 个 u64 值 的 方法 ， 而 是 u64 类 型 的 方法 ， 就 跟 C++ 或 
Java 中 的 静态 方法 类 似 。 而 且 from_str 函数 也 不 直接 返回 一 个 u64 值 ， 而 是 返回 一 个 表示 
解析 成 功 或 失败 的 Result 类 型 的 值 。Result 类 型 的 值 有 两 种 : 


。 Ok(v) 表示 解析 成 功 ，v 为 得 到 的 值 ， 
Err(e) 表示 解析 失败 ，e 为 包含 错误 信息 的 值 。 


所 有 涉及 输入 、 输 出 或 其 他 与 操作 系统 交互 的 函数 ， 都 会 返回 Result 类 型 的 值 。 如 果 返 回 
的 是 ok 值 ， 则 其 中 会 包含 操作 成 功 的 结果 ， 可 能 是 传输 的 字 市 数 ， 也 可 能 是 打开 的 文件 ， 
等 等 ， 如 果 返 回 的 是 Err 值 ， 则 其 中 会 包含 系统 返回 的 错误 码 。 与 大 多 数 现代 编程 语言 不 
同 ，Rust 没有 异常 的 概念 : 所 有 错误 都 使 用 Result 或 论 异 来 处 理 ， 第 7 章 将 详细 介绍 。 


接 下 来 ， 要 使 用 Result 的 expect 方法 检查 解析 的 结果 。 如 果 结 果 是 某 种 Err(e)，expect 
就 会 输出 e 中 包含 的 错误 消息 并 立即 退出 程序 。 而 如 果 结 果 是 ok(v)，expect 则 直接 返回 
v， 最 终 这 个 值 又 会 被 推 到 数值 向 量 的 末尾 。 

if numbers.Len() == 0 { 


writeln!(std::io::stderr(), "Usage: gcd NUMBER ...").unwrap(); 
std: :process: :exit(1); 

























































































} 


如 果 癌 量 中 根本 没有 数值 ， 那 么 自然 没 办 法 计算 最 大 公约 数 。 因 此 接 下 来 要 检查 向 量 中 至 
少 有 一 个 元 素 ， 如 果 一 个 元 素 也 没有 则 退出 程序 。 退 出 程序 之 前 ， 先 调用 writeln! 宏 向 标 
准 错误 输出 流 (由 std: :io::stderr() 返回 ) 中 写 和 人 错误 消息 。 最 后 调用 .unwrap() 是 检查 
输出 错误 消息 这 个 操作 本 身 没 有 失败 的 一 种 快捷 方式 ， 当 然 调 用 expect 也 可 以 检查 ， 只 是 
没 必 要 那么 小 题 大 做 。 

Let mut d = numbers[0]; 


for m in &numbers[1..] { 
d = gcd(d, *m); 
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紧 接 着 又 是 一 个 循环 ， 循 环 中 使 用 变量 d 作为 媒介 ， 保 存 每 次 循环 计算 得 到 的 最 大 公约 
数 。 跟 前 面 一 样 ， 必 须 将 d 标记 为 可 修改 才 可 以 在 循环 中 给 它 赋值 。 


关于 这 个 for 循环 ， 有 两 个 地 方 比 较 奇怪 。 首 先 ， 我 们 写 的 是 for m in &numbers[1..]， 
这 里 的 & 操作 符 是 干什么 用 的 ?其 次 ， 我 们 又 写 了 gcd(d，*m)， 那 么 xm 中 的 * 又 作 何 解 ? 
其 实 这 两 个 细节 是 相辅相成 的 。 

在 此 之 前 ， 我 们 的 代码 操作 的 都 是 像 整 数 这 种 占据 固定 大 小 内 存 空间 的 简单 值 。 而 现在 要 
迭代 一 个 向 量 ， 其 大 小 并 不 确定 ， 有 可 能 会 非常 大 。Rust 对 待 这 种 值 非常 慎重 ， 它 希望 程 
序 员 来 控制 内 存 用 度 ， 明 确 指出 每 个 值 存 活 多 入， 同时 还 要 保证 不 需要 时 立即 释放 内 存 。 


为 此 在 迭代 向 量 时 要 告诉 Rust， 向 量 的 所 有 权 仍 然 属 于 numbers， 循 环 中 仅仅 是 借用 其 元 
素 而 已 。&numbers[1..] 中 的 & 操作 符 表 示 从 向 量 的 第 二 个 元 素 开 始 ， 借 用 每 个 元 素 的 引 
用 。for 循环 迭代 的 是 每 个 元 素 的 引用 ， 进 而 让 mn 再 去 借用 每 个 元 素 。*m 中 的 * 操作 符 表 
示 对 m 解 引用 ， 即 取得 引用 所 指 的 值 ， 也 就 是 要 传 给 gcd 函数 的 第 二 个 u64 值 。 最 终 ， 
为 还 是 numbers 拥有 向 量 ， 所 以 Rust 会 在 numbers 脱离 main 函数 末尾 的 函数 作用 域 时 自动 


Rust 设计 的 所 有 权 和 引用 机 制 是 其 内 存 管理 及 安全 并 发 的 关键 ， 有 具体 细节 第 4 章 和 第 5 章 
将 讨论 。 要 想 得 心 应 手 地 编写 Rust 代码 ， 必 须 熟悉 这 些 规则 。 但 就 初次 体验 而 言 ， 只 要 知 
道 &x 是 借用 对 x 的 引用 ,而 *r 是 引用 r 所 指向 的 值 即 可 。 


继续 看 代码 : 


println!("The greatest common divisor of {:?} is {}", 
numbers, d); 


迁 代 完 numbers 的 元 素 ， 就 该 在 标准 输出 流 中 打印 结果 了 。println! 宏 接 收 一 个 模板 字符 
串 ， 将 后 面 的 参数 格式 化 之 后 再 去 替换 模板 字符 串 中 对 应 的 {.….3} 形式 的 部 分 ， 然 后 把 替 
换 后 的 结果 写 入 标准 输出 流 。 


C 和 C++ 要 求 main 国 数 在 程序 成 功 结束 时 返回 零 ， 发 生 错 误 时 返回 非 零 退 出 状态 
码 。Rust 则 认为 只 要 main 国 数 返 回 了 ， 程 序 就 成 功 结束 了 。 只 有 明确 调用 expect 或 
std: :process::exit 才 会 导致 程序 以 某 个 错误 状态 码 终止 。 


cargo run 命令 允许 向 程序 传递 参数 ， 因 此 可 以 这 样 来 测试 命令 行程 序 : 


$ cargo run 42 56 
Compiling hello vO.1.0 (file:///home/jimb/rust/hello) 
Finished dev [unoptimized + debuginfo] target(s) in 0.38 secs 
Running `/home/jimb/rust/hello/target/debug/hello 42 56° 
The greatest common divisor of [42, 56] is 14 
$ cargo run 799459 28823 27347 
Finished dev [unoptimized + debuginfo] target(s) in 0.0 secs 
Running `/home/jimb/rust/hello/target/debug/hello 799459 28823 27347. 
The greatest common divisor of [799459, 28823, 27347] is 41 
$ cargo run 83 
Finished dev [unoptimized + debuginfo] target(s) in 0.0 secs 
Running `/home/jimb/rust/hello/target/debug/hello 83° 
The greatest common divisor of [83] is 83 
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$ cargo run 


Finished dev [unoptimized + debuginfo] target(s) in 0.0 secs 
Running `/home/jimb/rust/hello/target/debug/hello. 
Usage: gcd NUMBER ... 


$ 


本 节 使 用 了 Rust 
议 你 去 看 看 Rust 


标准 库 中 的 一 些 特 性 。 如 果 想 知道 标准 库 中 还 包含 其 他 什么 特性 ， 强 烈 建 
的 在 线 文 档 。 在 线 文档 有 实时 搜索 功能 ， 浏 览 非常 方便 ， 其 中 其 至 包含 指 














向 源 代码 的 链接 。 在 安装 Rust 的 同时 ，rustup 命令 也 自动 在 你 的 计算 机 上 安装 了 一 份 文 
档 。 可 以 运行 如 下 命令 在 浏览 嚣 中 查阅 标准 库 的 文档 : 


$ rustup doc --std 


在 线 文档 地 址 见 





Rust 官方 网 站 。 


2.5 一 个 简单 的 Web 服 务 器 


可 以 从 crates.io 


自由 下 载 第 三 方 依赖 是 Rust 的 一 个 优势 。 要 在 代码 中 使 用 crates.io 上 的 





茶 个 包 ，cargo 命令 可 以 搞定 一 切 : 下 载 正确 的 版 本 、 构 建 代 码 、 必 要 时 升级 。Rust 包 ， 
无 论 是 一 个 库 还 是 可 执行 文件 ， 都 叫 crate (意思 是 “木板 集装箱 ”)。Cargo (货船 ) 和 
crates.io 都 是 因此 而 得 名 的 。 


为 说 明 如 何 使 用 





Rust 包 ， 本 节 将 组 装 一 个 简单 的 Web 服务 器 ， 会 用 到 基于 hyper HTTP 服 





务 器 的 iron Web 开发 框架 ， 以 及 它们 依赖 的 其 他 Rust 包 。 如 图 2-1 所 示 ， 我 们 的 网 站 会 
提示 用 户 输入 两 个 数字 ， 然 后 计算 它们 的 最 大 公约 数 。 























GCD Calculator -~ Mozilla Firefox x 
) GCD Calculator x \ 中 
€ | @ localhost:3000 vic|» | 三 
124 81 Compute GCD | 

















2-1: 可 以 计算 最 大 公约 数 的 网 页 
首先 ， 使 用 Cargo 创建 一 个 新 包 ， 将 其 命名 为 iron-gcd: 


$ cargo new 


--bin iron-gcd 


Created binary (application) ‘iron-gcd. project 
$ cd iron-gcd 


$ 

















然后 ， 修 改 新 项 目的 Cargo.toml 文件 ， 加 上 要 使 用 的 包 ， 结 果 如 下 : 





[package] 


name = "iron-gcd" 
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"O10" 
["You <you@example.com>"] 


version 
authors 


[dependencies] 

Tron = "0.5.1" 

mime = "0.2.3" 
router = "0.5.1" 
urlencoded = "0.5.0" 


在 Cargo.toml 的 [dependencies] 部 分 ， 每 一 行 都 列 出 了 一 个 crates.io 中 拥有 的 包 名 ， 以 及 
我 们 想 要 使 用 的 版 本 。 当 然 ，crates.io 上 的 这 几 个 包 很 可 能 有 了 比 这 里 更 新 的 版 本 ， 但 通 
过 在 这 里 指定 代码 实测 的 版 本 ， 可 以 保证 即使 这 些 包 有 了 新 版 本 ， 代 码 仍然 可 以 编译 。 关 
于 Rust 包 的 版 本 管理 ， 第 8 章 将 详细 讨论 。 

注意 ， 这 里 只 需 直 接 写 出 要 使 用 的 包 名 ， 而 这 些 包 的 依赖 统统 由 cargo 负责 引入 。 


初版 的 Web 服务 器 非常 简单 ， 只 响应 一 个 网 页 ， 其 中 包含 可 以 输入 数值 的 输入 所 
iron-gcd/src/main.rs 中 写 入 以 下 代码 : 


extern crate iron; 
#[macro_use] extern crate mime; 














ml 
讨 





Use iron::prelude::*; 
Use iron: :status; 


fn main() { 
println!("Serving on http://Llocalhost:3000..."); 
Iron: :new(get_form) .http("LocaLhost:3000") .unwrap(); 
} 


fn get form(_request: &mut Request) -> IronResult<Response> { 
let mut response = Response: :new(); 


response.set mut(status::0k); 
response.set mut(mime!(Text/Html; Charset=Utf8)); 
response.set _ mut(r#" 
<title>GCD Calculator</title> 
<form action="/gcd" method="post"> 
<input type="text" name="n"/> 
<input type="text" name="n"/> 
<button type="submit">Compute GCD</button> 
</form> 
"#); 


Ok(response) 


} 


代码 开头 是 两 个 extern crate 指令 ,分 别 将 Cargo.toml 文件 中 指定 的 iron 和 mime 引入 程 
序 中 。extern crate mime 这 一 行 前 头 的 #[macro_use] 属性 会 提醒 Rust， 我 们 打算 使 用 这 
个 包 导 出 的 宏 。 

之 后 ， 我 们 使 用 use 声明 导入 了 这 两 个 包 的 一 些 公有 特性 ， 其 中 ，use iron::prelude::* 
会 把 iron: :preLude 模块 中 所 有 的 公有 名 称 直接 暴露 在 代码 中 。 一 般 来 说 ， 明 确 指 定 要 
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使 用 的 特性 名 称 更 可 取 ， 比 如 像 iron: :status 这 样 。 不 过 按照 约定 ， 如 果 模 块 的 名 字 叫 
prelude， 那 就 说 明 它 所 导出 的 特性 是 使 用 该 包 的 任何 用 户 都 可 能 要 用 到 的 一 些 通用 特性 。 
因此 这 里 在 use 指令 中 使 用 通配符 * 更 合理 一 些 。 


我 们 的 main 函数 很 简单 ， 它 会 打印 一 条 消息 告诉 我 们 怎么 连接 到 服务 器 ， 调 用 Iron: :new 
来 创建 一 个 服务 器 ， 然 后 再 设置 让 服务 器 监听 本 机 TCP 的 3000 端口 。 这 里 把 get_form 函 
数 传 给 了 Iron: :new， 表 示 服 务 器 应 该 用 这 个 函数 来 处 理 所 有 请 求 。 稍 后 还 会 改 的 。 


get_form 函数 则 接收 一 个 可 修改 的 引用 (&mut)， 指 向 一 个 Request 类 型 的 值 ， 表 示 需 要 处 
理 的 HTTP 请 求 。 虽 然 当 前 这 个 处 理 函 数 并 没有 用 到 它 的 _request 参数 ， 但 后 面 的 处 理 函 
数 会 用 到 。 此 时 ， 在 参数 名 字 前 面 加 一 个 下 划 线 _ 是 告诉 Rust 预期 不 会 使 用 它 ， 就 不 要 因 
为 这 个 输出 警告 信息 了 。 


在 这 个 函数 体内 ， 我 们 构建 了 一 个 Response 值 。set_mut 方法 根据 参数 的 类 型 决定 设置 响 
应 的 哪 一 部 分 ， 因 此 每 次 调用 set_mut 都 会 设置 response 的 某 个 部 分 : 传人 status::0k 设 
置 HTTP 状态 码 ， 传 入 内 容 的 媒体 类 型 (使 用 从 mime 包 导 入 的 mime! 宏 ) 设置 Content- 
Type 首部 ， 传 和 字符 串 设 置 响应 体 。 


考虑 到 响应 文本 包含 很 多 双 引 号 ， 这 里 使 用 了 Rust 的 “原始 字符 串 ” 语 法 ， 即 在 r (raw) 
后 跟 一 个 或 多 个 # 和 一 个 双 引 号 ， 然 后 是 字符 串 内 容 ， 最 后 以 另 一 个 双 引 号 及 相同 个 数 的 
# 结尾 。 原 始 字 符 串 中 的 任何 字符 都 无 须 转 义 ， 包 括 双 引 号 。 事 实 上 ， 原 始 字 符 串 中 出 现 
的 以 \ 开头 的 转 义 序列 (如 \") 也 不 会 被 认为 是 转 义 序列 。 为 避免 歧义 ， 通 过 在 双 引 号 两 
侧 添加 更 多 的 #， 总 是 可 以 明确 标识 字符 串 的 结束 位 置 。 


最 后 ， 函 数 的 返回 类 型 IronResuLt<Response> 是 前 面 遇 到 的 Result 类 型 的 另 一 种 变 体 ， 它 
的 两 个 值 分 别 可 能 是 Ok(r) 和 Err(e)， 前 者 包含 成 功 的 响应 值 r， 后 者 包含 某 种 错误 值 e。 
在 函数 体 末 尾 ， 我 们 构建 了 要 返回 的 值 0k(response)， 并 利用 “最 后 一 个 表达 式 ” 语 法 隐 
式 指定 了 函数 的 返回 值 。 


写 完了 main.rs， 可 以 使 用 cargo run 命令 来 完成 运行 程序 所 需 的 一 切 工作 : 获取 必需 的 依 
赖 包 、 编 译 、 构 建 、 链 接 ， 然 后 启动 程序 : 


$ cargo run 
Updating registry ‘https://github.com/rust-lang/crates.io-index. 
Downloading iron vO.5.1 
Downloading urlencoded vO.5.0 
Downloading router vO.5.1 
Downloading hyper vO.10.8 
Downloading lazy_static vO.2.8 
Downloading bodyparser vO.5.0 
















































































Compiling conduit-mime-types vO.7.3 
Compiling iron vO.5.1 
Compiling router vO.5.1 
Compiling persistent vO.3.0 
Compiling bodyparser vO.5.0 
Compiling urlencoded vO.5.0 
Compiling iron-gcd v0.1.0 (file:///home/jimb/rust/iron-gcd) 
Running ‘target/debug/iron-gcd. 
Serving on http://Llocalhost:3000... 
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程序 启动 后 ， 在 浏览 器 中 打开 指定 的 URL， 就 可 以 看 到 图 2-1 所 示 的 页 面 了 。 


可 惜 现在 点 击 “Compute GCD” 还 没有 用 ， 只 能 重 定向 到 http://localhost:3000/gcd， 结 果 这 
是 显示 相同 的 页 面 (事实 上 ， 此 时 访问 服务 器 的 任何 URL 结果 都 一 样 )。 接 下 来 就 解决 
个 问题 ， 为 此 要 使 用 Router 类 型 将 不 同 的 路 径 关 联 到 不 同 的 处 理 程序 。 


首先 来 安排 一 下 ， 最 好 无 须 限 定名 就 能 直接 使 用 Router 。 那 就 要 在 iron-gcd/src/main.rs 中 
添加 以 下 声明 : 


extern crate router; 
use router::Router; 


Rust 程序 员 通 常 习惯 于 把 所 有 extern crate 和 use 声明 都 集中 起 来 放 到 文件 的 顶部 ， 实 
际 上 这 不 是 必需 的 。Rust 允许 这 些 声明 以 任何 顺序 出 现 ， 只 要 它们 所 在 的 艇 套 层次 没 错 
就 可 以 。( 有 个 例外 ， 宏 定义 和 以 #[macro_use] 属性 标记 的 extern crate 必须 在 使 用 之 前 
声明 。) 


接 下 来 把 rain 函数 改 成 这 样 : 


fn main() { 
let mut router = Router: :new(); 



































中 






































router.get("/", get form, "root"); 
router .post("/gcd", post gcd, "gcd"); 


println!("Serving on http://Llocalhost:3000..."); 
Iron::new(router).http("localhost:3000").unwrap(); 
} 


先 创建 了 一 个 Router， 为 两 个 特定 路 径 配 置 好 处 理 国 数 ， 然 后 再 将 这 个 Router 传 给 Iron: :new 
作为 请 求 处 理 程序 。 返 回 的 Web 服务 器 则 会 根据 URL 路 径 决 定 调用 哪个 处 理 函 数 。 


现在 可 以 写 post_gcd 函数 了 : 


extern crate urlencoded; 








use std::str::FromStr; 
use urlencoded: :UrlEncodedBody:; 


fn post_gcd(request: &mut Request) -> IronResult<Response> { 
Let mut response = Response::new(); 


Let form data = match request.get_ref::<UrLEncodedBody>() { 
Err(e) => { 
response.set_mut(status::BadRequest) ; 
response.set mut(format!("Error parsing form data: {:?}\n", e)); 
return Ok(response); 
} 
Ok(map) => map 
}; 


Let unparsed numbers = match form data.get("n") { 
None => { 





response.set_mut(status::BadRequest) ; 
response.set_mut(format!("form data has no 'n' parameter\n")); 
return Ok(response); 

} 

Some(nums) => nums 


}; 


let mut numbers = Vec::new(); 
for unparsed in unparsed numbers { 
match u64::from str(&unparsed) { 
Err(_) => { 
response.set_ mut(status::BadRequest); 
response.set_mut( 
format!("Value for 'n' parameter not a number: {:?}\n", 
unparsed)); 
return Ok(response); 
} 
Ok(n) => { numbers.push(n); } 


} 


Let mut d = numbers[0]; 
for m in &numbers[1..] { 
d = gcd(d, *m); 

} 


response.set_mut(status: :Ok); 
response.set_ mut(mime!(Text/Html; Charset=Utf8)); 
response.set_mut( 
format!("The greatest common divisor of the numbers {:?} is <b>{}</b>\n", 
numbers, d)); 
Ok(response) 
} 


这 个 函数 中 的 大 部 分 代码 是 match 表达 式 ，C、C++、Java 和 JavaScript 程序 员 可 能 不 熟悉 
它 ， 但 写 过 Haskell 和 OCaml 的 人 会 觉得 似曾相识 。 前 面 提 到 过 ，Result 的 值 要 么 是 包含 
成 功 值 s 的 Ok(s)， 要 么 是 包含 错误 值 e 的 Err(e)。 对 某 个 Resutt 值 res 而 言 ， 可 以 使 用 
像 下 面 这 样 的 match 表达 式 来 检查 它 是 哪 种 结果 ， 并 访问 其 中 的 值 : 

match res { 


Ok(success) => { ... }, 
Err(error) =>{...} 

















} 


这 是 一 个 类 似 C 中 if 或 switch 语句 的 条 件 表 达 式 ， 如 果 res 是 Ok(v)， 则 执行 第 一 个 分 
支 ， 其 中 变量 success 设置 为 v; 如 果 res 是 Err(e)， 则 执行 第 二 个 分 支 ， 变 量 error 设 
置 为 e。 这 里 的 success 和 error 是 各 自分 支 的 局 部 变量 。 整 个 match 表达 式 的 值 则 是 执行 
的 那个 分 支 返回 的 值 。 
使 用 match 表达 式 ， 程 序 必 须 先 检查 Result 是 哪 种 变量 ， 然 后 才能 访问 它 的 值 。 因 此 我 们 
永远 不 会 错误 地 把 一 个 失败 的 值 当 作成 功 的 值 。 这 正 是 match 表达 式 精 妙 的 地 方 。 在 C 和 
C++ 中， 忘记 检查 错误 码 或 空 指针 是 一 个 常见 的 错误 。 而 在 Rust 中 ， 这 类 错误 会 在 编译 时 
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被 捕获 到 。 这 个 简单 的 手段 大 幅 提升 了 程序 的 可 用 性 (usability ) 。 


Rust 支持 以 包含 值 的 变 体 创建 类 似 Resutt 的 自 定 义 类 型 ， 然 后 使 用 match 表达 式 来 对 其 
分 解 求 值 。Rust 称 这 种 自 定义 类 型 为 枚 举 (enum) ， 有 的 语言 可 能 





会 称 其 为 代数 数据 类 型 





(algebraic data type) 。 第 10 章 将 详细 讨论 枚 举 。 





理解 了 match 表达 式 ，post_gcd 的 结构 也 就 清楚 了 。 


。 调用 request.get_ref: :<UrLEncodedBody>() 将 请 求 体 解析 为 一 个 查找 表 ， 这 个 查找 表 保 





存 着 查询 参数 名 到 参数 值 的 数组 的 映射 。 如 果 人 解析 失败 , 则 通过 响应 向 客户 端 报告 错误 。 
这 个 方法 调用 中 的 : :<UrLEncodedBody> 是 一 种 类 型 参数 (type parameter) ， 表 示 要 取得 
Request get_ref 的 哪 一 部 分 。 在 此 ，UrlEncodedBody 类 型 指 的 是 作为 URL 编码 的 查询 
字符 串 解 析 的 请 求 主体 。 下 一 节 会 详细 介绍 类 型 参数 。 

在 这 个 查找 表 中 ， 找 到 参数 名 为 "n" 的 值 ， 其 中 保存 着 通过 HTML 表单 输入 的 数值 。 
但 这 个 值 不 是 单个 字符 串 ， 而 是 一 个 字符 串 向 量 ， 因 为 查询 参数 名 是 会 重复 的 。 

















。 接着 遍历 这 个 字符 串 向 量 ， 将 每 个 字符 串 解 析 为 一 个 无 符号 64 位 整数 。 如 果 任 何 一 个 


字符 串 解 析 失 败 ， 则 返回 相应 的 失败 页 。 

最 后 ， 像 之 前 那个 例子 一 样 计算 最 大 公约 数 ， 并 构建 一 个 响应 来 描述 结果 。 这 里 的 
format! 宏 使 用 与 writeln! 和 printtnl 宏一 样 的 字符 串 模 板 , 但 它 会 返回 一 个 字符 串 值 ， 
而 不 是 把 字符 串 写 入 输出 流 。 











剩 下 的 就 是 前 面 写 的 gcd 函数 了 。 有 了 这 些 代 码 ， 就 可 以 终止 之 前 运行 的 服务 器 ， 重 新 构 
建 并 重新 启动 程序 了 : 





$ cargo run 
Compiling iron-gcd v0.1.0 (file:///home/jimb/rust/iron-gcd) 
Finished dev [unoptimized + debuginfo] target(s) in 0.0 secs 
Running ‘target/debug/iron-gcd. 
Serving on http://Llocalhost:3000... 


再 打开 http:/localhost:3000， 输 入 一 些 数值 ， 单 击 “Compute GCD” 按 钮 ， 就 真 的 可 以 看 
到 结果 了 (如 图 2-2 所 示 )。 














Mozilla Firefox x 





J) http://localhost:3000/gcd x*\ 中 


€ | @ localhost:3000/gcd v| C | ? 


The greatest common divisor of the numbers [24, 81] is 3 

















2-2: 显示 计算 得 到 的 最 大 公约 数 的 Web 页 面 





2.6 并 发 


支持 并 发 编程 是 Rust 的 一 大 优势 。 确 保 Rust 程序 没有 内 存 错误 的 规则 ， 同 样 可 以 确保 线 

程 只 能 在 避免 数据 和 争 用 的 前 提 下 共享 内 存 。 举 几 个 例子 来 说 明 。 

。 在 使 用 互 斥 量 协调 多 线程 修改 共享 数据 结构 的 情况 下 ，Rust 可 以 保证 只 有 持 有 锁 的 线程 
才能 存 取 数 据 ， 而 且 操 作 完成 后 会 自动 释放 锁 。 在 C 和 C++ 中 ， 互 斥 量 与 它 所 保护 数 
据 的 这 种 关系 只 能 靠 注释 来 描述 。 

。 在 多 个 线程 间 共享 只 读数 据 时 ,Rust 可 以 保证 程序 不 会 意外 修改 该 数据 。 在 C 和 C++ 中 ， 
类 型 系统 也 有 助 于 起 到 保护 作用 ， 但 很 容易 出 错 。 

。 在 把 某 个 数据 结构 的 所 有 权 由 一 个 线程 转移 到 另 一 个 线程 时 ，Rust 可 以 保证 前 一 个 线程 
确 确 实 实 让 渡 了 所 有 的 权力 。 而 在 C 和 C++ 中 ， 只 能 靠 程 序 员 自己 检查 来 保证 前 一 个 
线程 不 会 再 磁 该 数据 。 如 果 保 证 不 了 ， 那 后 果 则 要 取决 于 处 理 器 缓存 里 当时 有 什么 ， 或 
者 最 近 对 内 存 执行 了 多 少 次 写 操作 。 这 些 我 们 都 经 历 过 。 

本 市 将 带 大 家 编程 第 二 个 多 线程 程序 。 

了 臣 怕 不 少 人 还 没有 意识 到 ， 本 书 前 面 已 经 写 了 一 个 多 线程 程序 了 。 在 求 最 大 公约 数 的 那个 

Web 应 用 里 ， 实 现 服 务 器 的 Web 框架 Iron 使 用 了 线程 池 来 运行 处 理 函 数 。 如 果 服 务 器 同 

时 收 到 多 个 请 求 ， 那 么 它 可 能 会 同时 启动 多 个 线程 来 运行 get_form 和 post_gcd 函数 。 听 

到 这 些 ， 可 能 有 人 会 很 担心 ， 因 为 我 们 在 写 这 两 个 函数 时 ， 压 根 没 想 过 并 发 的 事 。 别 紧 

张 ，Rust 保证 这 么 做 不 会 出 问题 ， 无 论 服务 器 有 多 复杂 。 只 要 你 的 程序 编译 通过 ， 就 不 用 

担心 数据 争 用 了 。 所 有 Rust 函数 都 是 线程 安全 的 。 

本 节 要 写 的 多 线程 程序 用 来 绘制 曼 德 布 洛 特 (Mandelbrot) 集合 ， 也 就 是 在 复 平面 上 构成 

分 形 的 点 的 集合 。 绘 制 曼 德 布 洛 特集 合 属于 所 谓 的 “ 尴 座 并 行 ”(embarrassingly parallel) 

算法 ， 因 为 线程 间 的 通信 模式 简单 到 让 人 寸 众 。 第 19 章 将 讨论 更 复杂 的 模式 。 不 过 ， 这 

个 例子 虽然 简单 ， 却 也 能 演示 一 些 根本 的 问题 。 

首先 ， 创 建 一 个 新 的 Rust 项 目 : 


$ cargo new --bin mandelbrot 
Created binary (application) ‘mandelbrot. project 


所 有 代码 都 将 写 到 mandelbrot/src/main.rs 里 ， 当 然 也 需要 在 mandelbrot/Cargo.toml 中 添加 
一 些 依赖 。 


在 讨论 并 发 曼 德 布 洛 特 实现 之 前 ， 需 要 先 搞 清楚 要 做 什么 计算 。 


2.6.1 到 底 什 么 是 曼 德 布 洛 特集 合 


看 代码 的 时 候 ， 最 好 能 联想 到 代码 具体 在 做 什么 。 因 此 ， 我 们 稍微 偏离 一 点 主题 ， 复 习 一 
些 纯 数学 的 知识 ， 先 从 最 简单 的 情形 开始 ， 然 后 逐步 增加 复杂 度 ， 直 到 最 终 揭 示 出 曼 德 布 
次 特集 合 的 核心 算法 。 

下 面 是 一 个 无 穷 循环 ， 使 用 了 Rust 专门 为 此 编写 的 语法 











































































































Loop 语句 : 
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fn square_loop(mut x: f64) { 
Loop { 


} 


实际 运行 中 ，Rust 发 现任 何 地 方 都 没有 用 到 x， 因 此 不 会 计算 它 的 值 。 但 就 眼下 而 言 ， 假 
设 前 面 的 代码 会 像 写 的 那样 运行 。 那 么 想 一 下 ，x 的 值 会 如 何 变化 ? 对 任何 小 于 1 的 数 求 
平方 会 得 到 更 小 的 数 ， 即 结果 趋 近 于 零 。! 的 平方 还 是 1。 对 任何 大 于 1 的 数 求 平方 会 得 
到 更 大 的 数 ， 即 结果 趋 近 于 无 穷 。 负 数 的 平方 会 变 成 正 数 ， 此 后 就 像 前 面 几 种 情形 一 样 了 
(如 图 2-3 所 示 )。 




















图 2-3: 重复 计算 一 个 数 的 平方 
因此 ， 根 据 传 给 square_loop 的 值 ，x 要 么 会 趋 近 于 零 ， 要 么 一 直 是 1， 要 么 会 趋 近 于 无 穷 。 


现在 再 看 一 个 不 太一 样 的 循环 : 


fn square_add_Loop(c: f64) { 
let mut x = 0.; 
Loop { 
义 三 XXX 二 EC 








} 
} 


这 一 次 ，x 从 0 开始， 每 次 迭代 都 会 在 求 平方 之 后 加 上 一 个 c。 如 此 一 来 ， 就 不 容易 看 出 
x 的 变化 趋势 了 。 别 急 ， 实 验 表 明 ， 如 果 c 大 于 0.25 或 小 于 -2.0， 则 x 最 终 会 趋 近 于 无 穷 
大 ; 否则 ，x 就 会 待 在 邻近 0 的 某 个 地 方 。 


继续 增加 一 点 复杂 度 : 在 循环 中 把 f64 值 换 成 复数 。crates.io 上 的 nun 包 提 供 了 可 以 使 用 
的 复数 类 型 ， 因 此 把 它 加 到 Cargo.toml 文件 的 [dependencies] 部 分 。 目 前 为 止 ， 这 个 文件 
的 全 部 内 容 如 下 〈 稍 后 还 要 添加 其 他 依赖 ) : 

[package] 

name = "mandelbrot" 


version = "0.1.0" 
authors = ["You <you@example.com>"] 














[dependencies] 
num = "0.1.27" 


现在 来 编写 循环 的 倒数 第 二 个 版 本 : 


extern crate num; 
Use Num::Complex; 
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#[aLLow(dead_code)] 
fn complex_square_add_loop(c: CompLex<f64>) { 
let mut z = Complex { re: 0.0, im: 0.0 }; 
Loop { 
ZE= ZZ + 
} 
} 


惯例 是 用 z 表示 复数 ， 所 以 这 里 重 命 名 了 循环 变量 。 表 达 式 Complex { re: 0.9, im: 0.0 } 
是 基于 nun 包 的 Complex 类 型 表示 复数 0 的 写法 。Complex 是 一 个 Rust 结构 体 类 型 定义 
如 下 : 
struct CompLex<T> { 
/// 复数 的 实数 (real) 部 分 


re: T, 

/// 复数 的 虚数 (imaginary) 部 分 

im: T 

} 

以 上 代码 定义 了 一 个 名 为 Complex 的 结构 体 ， 这 个 结构 体 有 两 个 字段 : re 和 im。 而 且 ， 
Complex 还 是 一 个 泛 型 (generic) 结构 体 ， 代 码 中 跟 在 类 型 名 后 面 的 <T> 可 以 理解 为 “ 任 
何 类 型 T”。 比 如 ，Complex<f64> 就 表示 其 re 和 in 字段 均 为 f64 值 的 复数 ，Complex<f32> 
则 使 用 32 位 浮 点 值 。 基 于 这 个 定义 ， 表 达 式 Complex { re: R，im: I } 会 生成 一 个 re 字 
段 初始 化 为 R、iinm 字段 初始 化 为 工 的 Complex 值 。 


num 包 人 负责 处 理 对 Complex 值 的 *、+ 以 及 其 他 算术 操作 ， 因 此 这 个 函数 的 其 他 代码 跟 之 前 
一 样 ， 只 不 过 现在 计算 的 不 再 是 实数 轴 上 的 点 ， 而 是 复 平面 上 的 点 了 。 第 12 章 将 介绍 如 
何 让 Rust 操作 符 处 理 自 定义 类 型 的 数据 。 


好 了 ， 简 短 的 纯 数学 回顾 之 旅 至 此 就 结束 了 。 曼 德 布 洛 特集 合 就 是 这 样 一 组 复数 c 的 集 
合 : 对 于 任意 < 值 ，z 都 不 会 接近 无 穷 大 。 我 们 最 初 的 简单 平方 循环 很 容易 断言 : 任何 大 
于 1 或 小 于 -1 的 数 都 会 很 快 接近 无 穷 大 。 每 次 循环 多 了 一 个 + 5 也 加 大 了 预测 难度 : 前 
而 说 过 ， 大 于 0.25 或 小 于 -2.0 的 < 值 会 导致 > 接近 无 穷 大 。 把 这 个 游戏 扩展 到 复数 领域 ， 
则 会 得 到 奇异 又 迷人 的 图 案 ， 那 正 是 我 们 想 要 绘制 出 来 的 。 


复数 c 有 实 部 c.re 和 虚 部 c.im， 我 们 将 其 看 作 平 面 直角 坐标 系 中 的 x 和 >y 坐标 ， 且 如 果 < 
属于 曼 德 布 洛 特集 合 ， 就 将 该 点 绘制 为 黑色 ， 否 则 就 绘制 为 其 他 更 浅 的 颜色 。 那 么 对 图 像 
中 的 每 个 像素 ， 都 必须 基于 复 平面 上 对 应 的 点 来 运行 前 面 的 循环 ， 根 据 它 会 飞 向 无 穷 远 还 
是 永远 围绕 圆心 旋转 来 决定 这 个 像素 的 颜色 。 

无 穷 循 环 要 花费 时 间 ， 但 可 以 用 两 个 技巧 来 应 对 。 首 先 ， 放 弃 运 行 起 来 没完 的 思路 ， 而 是 
只 运行 有 限 次 ， 仍 然 可 以 得 到 近似 的 集合 。 至 于 运行 多 少 次 ， 取 决 于 我 们 希望 绘制 的 边界 
的 精度 。 其 次 ， 事 实 表 明 ， 如 果 z 离开 了 以 原点 为 圆心 、 半 径 为 2 的 圆 ， 那 么 它 最 终 一 定 
会 飞 同 离 原点 无 穷 远 。 

下 面 就 是 最 终 版 的 循环 ， 也 是 整个 程序 的 核心 : 
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extern crate num; 
Use Num::Complex; 


/// 确定 c 是 否 属于 曼 德 布 洛 特集 合 ， 最 多 循环 Limit 次 
/// 


/// 如 果 c 不 是 成 员 ， 就 返回 Some(i)， 其 中 i 是 在 z 离 开 以 原点 为 圆心 、 
/// 半径 为 2 的 圆 时 循环 的 次 数 。 如 果 c 是 成 员 (更 准确 地 说 ， 若 达到 
/// 循环 上 限 尚未 证 明 c 不 是 成 员 ) ， 则 返回 None 
fn escape_time(c: Complex<f64>, limit: u32) -> Option<u32> { 
Let mut z = Complex { re: 0.0, im: 0.0 }; 
for i in 0..Limit { 
ZZ 7 + 
if z.norm sqr() > 4.0 { 
return Some(i); 












































None 





这 个 函数 有 两 个 参数 : < 是 一 个 复数 ， 我 们 要 测试 它 是 否 属 于 曼 德 布 洛 特集 合 ，Limit 是 循 
环 次 数 的 上 限 ， 到 这 个 次 数 就 认为 < 应 该 是 成 员 。 
国 数 的 返回 值 是 一 个 0ption<u32>。Rnust 标准 库 是 这 样 定义 0ption 类 型 的 : 

enum Option<T> { 


None, 
Some(T) ， 





} 


Option 是 一 个 可 枚 举 类 型 ， 简 称 枚 举 ， 因 为 其 定义 枚 举 了 该 类 型 值 的 几 种 可 能 变 体 ， 对 任 
意 类 型 T，0ption<T> 类 型 的 值 要 么 是 Some(v) (其 中 v 是 T 类 型 的 值 )， 要 么 是 None (表示 
没有 T 类 型 的 值 可 用 )。 跟 前 面 讨论 过 的 Complex 类 型 一 样 ，0ption 也 是 一 个 泛 型 类 型 ， 即 
可 以 使 用 0ption<T> 来 表达 任何 类 型 T 的 一 个 可 选 值 。 

在 这 里 ，escape_time 返回 一 个 0ption<u32>， 用 以 表示 < 是 否 在 曼 德 布 洛 特 集合 中 ， 如 
果 不 在 ， 则 返回 知道 这 个 结果 循环 了 多 少 次 。 如 果 c 不 在 集合 中 ，escape_time 会 返回 
Some(i)， 其 中 i 就 是 z 离开 半径 为 2 的 圆 时 循环 的 次 数 。 否 则 ，c 显然 在 集合 中 ，escape_ 


time 返回 None。 









































for i in 0..Limit { 


前 面 的 例子 展示 了 和 迭代 命令 行 参数 和 向 量 元 素 的 for 循环 ， 而 这 个 for 循环 迭代 的 是 一 个 
整数 范围 : 从 0 到 Limit (不 包含 )。 


z.norm_sqr() 方法 调用 返回 z 到 原点 距离 的 平方 。 为 确定 z 是 否 离开 了 半径 为 2 的 圆 ， 不 
计算 平方 根 ， 而 用 距离 的 平方 与 4.0 比较 会 更 快 。 

念 怕 你 已 经 注意 到 了 ， 我 们 用 /// 在 前 面 的 函数 定义 中 标记 了 注释 行 ， 而 Complex 结构 体 
成 员 上 方 的 注释 同样 以 /// 开头 。 这 种 注释 叫 作文 档 注释 ，rustdoc 实用 工具 知道 如 何 解 
析 文 档 注释 以 及 它们 描述 的 代码 ， 并 生成 在 线 文档 。Rust 标准 库 的 文档 就 是 以 这 种 方式 写 
成 的 。 第 8 章 将 详细 介绍 文档 注释 。 
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站 


程序 的 其 余部 分 还 需要 确定 集合 的 哪 一 部 分 以 什么 分 辨 率 绘制 ， 并 将 工作 分 配给 多 个 线程 
以 加 快 计算 速度 。 


2.6.2 解析 成 对 的 命令 行 参数 


程序 需要 几 个 命令 行 参数 来 控制 要 生成 图 像 的 分 辨 率 ， 以 及 图 像 要 展示 的 曼 德 布 洛 特集 合 
的 范围 。 由 于 命令 行 参数 都 具有 约定 的 格式 ， 因 此 可 以 写 一 个 函数 来 解析 它们 : 


use std::str::FromStr; 


















































/// 解析 字符 串 s， 格 式 为 一 对 坐标 值 ， 如 "460x609 "或 "1.0,0.5" 
/// 


/// 特别 地 ，s 的 格式 应 该 是 "< 左 值 >< 分 隔 符 >< 右 值 >" 的 形式 ， 其 中 < 分 隔 符 > 
/// 就 是 separator 参 数 传 入 的 字符 ， 而 < 左 值 > 和 < 右 值 > 都 是 字符 串 ， 可 以 通过 
/// T::from_str 来 解析 
/// 
/// 如 果 s 的 格式 没 错 ， 就 返回 Some<(x，y)>。 如 果 解 析出 错 ， 则 返回 None 
fn parse_pair<T: FromStr>(s: &str, separator: char) -> Option<(T, T)> { 
match s.find(separator) { 
None => None, 
Some(index) => { 
match (T::from str(&s[..index]), T::from str(&s[index + 1..])) { 
(Ok(1), Ok(r)) => Some((l, r)), 
































_ => None 
} 
} 
} 
} 
#[test] 
fn test parse pair() { 
assert_eq!(parse_pair::<i32>("", ','), None); 
assert_eq!(parse_pair::<i32>("10,", ','), None); 
assert_eq!(parse_pair::<i32>(",10", ','), None); 


assert_eq!(parse_pair::<i32>("10,20", ','), Some((10, 20))); 

assert_eq!(parse_pair::<i32>("10,20xy", ','), None); 

assert_eq!(parse_pair::<f64>("0.5x", 'x'), None); 

assert_ eq!(parse_pair::<f64>("0.5x1.5", 'x'), Some((0.5, 1.5))); 
} 


这 个 parse_pair 是 一 个 泛 型 函数 (generic function) : 
fn parse_pair<T: FromStr>(s: &str, separator: char) -> Option<(T, T)> { 

国 数 名 后 面 的 <T: FromStr> 表示 “任何 实现 了 Fromstr 特 型 的 类 型 T”"。 这 个 泛 型 声明 让 
我 们 一 次 性 定义 了 一 整套 国 数 : parse_ 是 解析 成 对 的 132 值 的 函数 ，parse_ 
pair::<f64> 是 解析 成 对 的 浮 点 值 的 国 数 ， 等 等 。 这 跟 C++ 中 的 函数 模板 非常 类 似 。Rust 
程序 员 称 T 为 parse_pair 的 类 型 参数 (type parameter)。 在 使 用 泛 型 函数 时 ，Rust 通常 可 
以 帮 有 我 们 推断 类 型 参数 ， 因 而 没 必要 像 前 面 测试 代码 中 那样 把 类 型 都 写 出 来 。 
函数 的 返回 类 型 是 0ption<(T，T)>， 即 要 么 是 None， 要 么 是 值 Some((v1，v2))， 其 中 ， 
(v1，v2) 是 包含 两 个 T 类 型 值 的 元 组 。 由 于 没有 显 式 返 回 语句 ， 因 此 parse_pair 函数 的 返 
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回 值 就 是 函数 体 中 最 后 (也 是 唯一 ) 一 个 表达 式 的 值 : 


match s.find(separator) { 
None => None, 
Some(index) => { 


} 
} 


string 类 型 的 find 方法 会 从 字符 串 中 搜索 与 separator 匹配 的 字符 。 如 果 find 返回 None， 
则 意味 着 字符 串 里 没有 分 隔 符 字符 ， 整 个 match 表达 式 即 求 值 为 None， 表 示 解 析 失 败 。 否 
则 ， 我 们 将 index 作为 字符 串 中 分 隔 符 的 位 置 。 

match (T: :from_str(&s[..index])，T::from_str(&s[index + 1..])) { 


(Ok(1), Ok(r)) => Some((L，r))， 
_ => None 








} 
从 这 里 可 以 看 到 match 表达 式 的 威力 。 此 处 要 匹配 的 参数 是 一 个 元 组 表达 式 : 
(T::from_str(&s[..index]), T::from str(&s[index + 1..])) 
表达 式 &s[. .index] 和 &s[index + 1..] 是 分 别 位 于 分 隔 符 前 后 的 字符 串 片 段 。 与 类 型 参数 
T 关 联 的 from_str 函数 接收 这 两 个 字符 串 片 段 ， 并 淮 试 将 它们 解析 为 T 类 型 的 值 ， 最 后 得 
到 结果 的 二 元 组 。 下 面 是 要 匹配 的 模式 : 
(Ok(1), Ok(r)) => Some((1, r)), 
这 个 模式 只 匹配 元 组 的 两 个 元 素 都 是 Result 的 ok 变 体 的 情况 ， 表 示 二 者 均 解 析 成 功 。 如 
果 模 式 匹 配 ，Some((L，r)) 就 是 match 表达 式 的 值 ， 也 就 是 函数 的 返回 值 。 
_ => None 
通配符 模式 _ 匹配 任何 东西 ， 但 忽略 其 值 。 如 果 到 了 这 个 分 支 ， 那 么 说 明 parse_pair 解析 
失败 了 ， 因 此 求 值 结果 为 None， 同 样 也 作为 这 个 函数 的 返回 值 。 
有 了 parse_pair， 那 编写 一 个 解析 浮 点 坐标 值 对 的 函数 就 简单 了 ， 这 个 函数 返回 
Complex<f64> 值 : 


/// 将 由 逗号 分 隔 的 一 对 浮 点 数值 解析 为 一 个 复数 
fn parse_complex(s: &str) -> Option<Complex<f64>> { 
match parse_pair(s, ',') { 
Some((re, im)) => Some(Complex { re, im }), 
None => None 























} 


#[test] 
fn test_parse complex() { 
assert_eq!(parse_complex("1.25,-0.0625"), 
Some(Complex { re: 1.25, im: -0.0625 })); 
assert eq!(parse_complex(",-0.0625"), None); 





这 个 parse_complex 国 数 调 用 了 parse_pair。 如 果 坐 标 解 析 成 功 ， 就 构建 一 个 Complex 值 ， 
如 果 失 败 ， 则 消息 也 会 传 给 调用 者 。 


如 果 仔 细 看 ， 你 会 发 现 这 里 在 构建 Complex 值 时 使 用 了 简写 方式 。 因 
七 结构 体 字 段 的 情况 很 常见 ， 所 以 Rust 支持 以 Complex { re，im 的 简单 形式 代替 
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Complex { re: re，im: im }。 这 一 点 模仿 了 JavaScript 和 Haskell 中 的 类 似 语法 。 


2.6.3 ”像素 到 复数 的 映射 
我 们 的 程序 需要 对 接 两 个 相关 的 坐标 空间 ， 即 要 把 输出 图 像 的 每 个 像素 都 对 应 到 复 平 面 上 
的 一 个 点 。 这 两 个 空间 的 对 应 关系 取决 于 要 绘制 的 是 曼 德 布 洛 特集 合 中 的 哪 一 部 分 ， 以 及 
图 像 的 分 辩 率 (由 命令 行 参 数 决 定 ) 。 下 面 这 个 国 数 负责 从 图 像 空间 到 复数 空间 的 转换 : 




















/// 给 定 输出 图 像 中 一 个 像素 的 行 和 列 ， 对 应 到 复 平 面 上 的 一 个 点 
/// 
/// bounds 是 一 个 元 组 ， 值 为 以 像素 计量 的 图 像 的 宽 和 高 
/// pixel 是 ( 列 , 行 ) 元 组 ， 表 示 图 像 中 一 个 特定 的 像素 
/// upper_left 和 Lower_right 参 数 是 复 平面 中 的 两 个 点 ， 
/// 指定 了 图 像 涵盖 的 区 域 
fn pixel_ to_ point(bounds: (usize, usize), 
pixel: (usize, usize), 
upper_left: Complex<f64>, 
Lower_right: Complex<f64>) 
-> Complex<f64> 












































Let (width, height) = (Lower_right.re - upper_left.re, 
upper_left.im - lower_right.im); 
Complex { 
re: Upper_Left.re + pixeL.0 as f64 * width / bounds.0 as f64, 
im: Upper_Left.im - pixel.1 as f64 * height / bounds.1 as f64 
// 这 里 为 什么 要 用 减法 ?pixel.1 越 往 下 越 大 ， 而 虚 部 越 往 上 越 大 





} 


#[test] 
fn test pixel to point() { 
assert_ eq!(pixel_to_point((100, 100), (25, 75), 
Complex { re: -1.0, im: 
Complex { re: 1.0, im: -1. 
Complex { re: -0.5, im: -0.5 }); 


2 
©O©O 
cm 


} 


2-4 展示 了 pixel_to_point 执行 的 计算 。 


为 使 用 同名 变 
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复数 点 
upper_left bounds.0 


-/ 





0 行 0 列 的 像素 


日 给 定 行 和 列 位 置 的 像素 对 应 什么 复数 点 ? 


bounds.1 


bounds.1-1 行 bounds.0-1 列 的 像素 ， 
复数 点 J 
lower_right 
图 2-4: 复 平面 与 图 像 像 素 的 对 应 关系 


pixel_to_point 的 代码 只 涉及 简单 计算 ， 因 此 这 里 就 不 详细 介绍 了 。 不 过 ， 有 几 个 地 方 还 
是 要 说 一 下 。 这 种 形式 的 表达 式 表 示 引 用 元 组 的 元 素 : 


pixel.0 


这 表示 引用 元 组 pixel 的 第 一 个 元 素 。 


pixel.0 as f64 


这 是 Rust 的 类 型 转换 语法 : 把 pixel.9 转换 为 f64 值 。 与 C 和 C++ 不 同 ，Rust 通 稼 会 拒 
绝 数 值 类 型 的 隐 式 转换 ， 要 转换 就 必须 写 出 来 。 虽然 略 显 喝 唆 ， 但 明确 指出 怎么 转换 、 何 
时 转换 还 是 非常 有 用 的 。 隐 式 的 整数 转换 虽然 看 起 来 没 问 题 ， 但 历史 经 验 表 明 ， 它 一 直 是 
很 多 C 和 C++ 代码 中 问题 和 安全 漏洞 之 源 。 


2.6.4 绘制 集合 


要 绘制 曼 德 布 洛 特集 合 ， 对 于 图 像 中 的 每 个 像素 ， 只 需 给 复 平面 中 对 应 的 点 应 用 escape_ 
time， 并 根据 结果 确定 像素 的 颜色 即 可 : 


7 


/// bounds 参 数 给 出 缓冲 区 pixeLs 的 宽度 和 高 度 ， 后 者 的 每 个 字 节 都 保存 一 个 
/// 灰 阶 像素 。upper_left 和 Lower_right 参 数 指定 与 像素 缓冲 区 中 左上 角 和 
/// 右 下 角 的 点 对 应 的 复 平面 上 的 点 
fn render(pixels: &mut [u8], 

bounds: (usize, usize), 

upper_left: Complex<f64>, 

Lower_right: CompLex<f64>) 
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assert!(pixels.len() == bounds.0 * bounds.1); 





for row in 0 .. bounds.1 { 
for column in 0 .. bounds.0 { 
Let point = pixel_ to_ point(bounds, (column, row), 
upper_left, lower_right); 
pixels[row * bounds.0 + column] = 
match escape_time(point, 255) { 

None => 0， 
Some(count) => 255 - count as u8 


} 


} 
此 时 此 刻 ， 这 些 应 该 没有 什么 看 不 懂 的 。 


pixels[row * bounds.0 + CoLumn] = 
match escape_time(point, 255) { 
None => 0， 
Some(count) => 255 - count as u8 
}; 
如 果 escape_time 说 point 属于 曼 德 布 洛 特 集合 ， 就 将 对 应 像素 演 染 为 黑色 (9)。 否 则 ， 
脱离 圆 形 越 晚 的 点 颜色 就 越 深 。 


2.6.5 ” 写 出 图 像 文件 
image 包 不 仅 提 供 了 读 写 各 种 格式 图 片 的 功能 ， 还 提供 了 一 些 基本 的 图 像 操 作 功 能 。 特 别 
是 它 内 置 了 一 个 PNG 图 像 文件 格式 的 编码 器 ， 我 们 的 程序 要 用 它 保存 最 终 计算 的 结果 。 
要 使 用 image， 在 Cargo.toml 文件 的 [dependencies] 部 分 加 上 下 面 这 行 代码 : 

image = "0.13.0" 
声明 这 个 依赖 后 ， 就 可 以 继续 写 : 


extern crate image; 





























use image::ColorType; 
use image::png::PNGEncoder; 
use std::fs::File; 


/// 把 缓冲 区 中 的 pixels (大 小 由 bounds 指 定 ) 写 到 

/// 名 为 filename 的 文件 

fn write_image(filename: &str, pixels: &[u8], bounds: (usize, usize)) 
-> Result<(), std::io::Error> 





UD 





{ 
Let output = File::create(filename)?; 
let encoder = PNGEncoder: :new(output); 
encoder .encode(&pixels, 
bounds.0 as uy32, bounds.1 as u32, 
ColorType: :Gray(8))?; 
Ok(()) 
} 
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这 个 函数 的 操作 非常 直观 ， 打 开 一 个 文件 ， 把 图 像 写 进去 。 我 们 传 给 编译 器 的 实际 的 像 
素数 据 pixels， 它 的 宽 和 高 来 自 bounds， 最 后 一 个 参数 表示 如 何 解释 ptxets 中 的 字 节 。 
ColorType: :Gray(8) 的 意思 是 每 个 字 节 表示 一 个 8 位 灰 度 值 。 


这 些 都 没什么 。 这 个 函数 有 意思 的 地 方 是 错误 处 理 。 如 果 遇 到 错误 ， 则 需要 把 错误 回 传 给 
调用 者 。 如 前 所 述 ，Rust 容易 出 错 的 国 数 应 该 返回 Result 值 ， 要 么 是 表示 成 功 的 Ok(s)， 
要 么 是 表示 失败 的 Err(e)， 基 中 s 和 ee 分别 是 成 功 值 和 错误 码 。 那 write_image 的 成 功 和 
错误 是 什么 类 型 ? 

如 果 一 切 顺利 ，write_image 国 数 不 会 返回 有 用 的 值 ， 有 用 的 数据 都 写 到 文件 里 了 。 因 此 
其 成 功 类 型 就 是 基 元 (unit) 类 型 ()， 因 为 这 种 类 型 只 有 一 个 值 ， 也 是 ()。 基 元 类 型 有 点 
像 C 和 C++ 中 的 void。 


如 果 发 生 错 误 ， 可 能 是 File::create 不 能 创建 文件 引起 的 ， 也 可 能 是 encoder .encode 
无 法 将 图 像 写 入 文件 造成 的 ，LIO 操作 就 会 返回 一 个 错误 码 。File::create 返回 的 
是 ResuLt<std::fs::FiLe，std::io::Error>， 而 encoder.encode 返回 的 是 ResuLt<()， 
std::io::Erro>， 即 二 者 的 错误 类 型 一 样 ， 都 是 std: :io::Error。 为 此 ，write_image 只 要 
使 用 相同 的 错误 类 型 就 好 了 。 
考虑 一 下 对 File::create 的 调用 。 如 果 成 功 打开 的 Fite 值 f 返 回 Ok(f)， 那 么 write_ 
image 就 会 进一步 向 f 中 写 入 图 像 数据 。 但 如 果 FitLe::create 返回 包含 错误 码 e 的 Err(e)， 
那么 write_image 应 该 立即 以 Err(e) 作为 它 自己 的 返回 值 。 同 时 ， 对 encoder .encode 的 调 
用 也 必须 同样 处 理 : 失败 则 立即 返回 ， 传 出 错误 码 。 
使 用 ? 操作 可 以 简化 这 些 检查 。 原 来 要 像 这 样 全 部 写 出 来 ， 

Let output = match File::create(filename) { 


Ok(f) => { f } 
Err(e) => { return Err(e); } 


































































































}; 
现在 ， 等 价 却 更 简洁 的 写法 如 下 : 


Let output = File::create(filename)?; 








试图 在 main 函数 中 使 用 ? 是 初学 者 常 犯 的 错误 。 因 为 main 函数 没有 返回 值 ， 
所 以 这 种 写法 无 效 。 正 确 的 做 法 是 使 用 Resutt 的 expect 方法 。? 操作 符 只 
对 那些 返回 Result 的 函数 有 用 。 



































其 实 这 里 还 有 一 种 简写 语法 可 以 使 用 。 因 为 针对 某 种 类 型 T 返 回 Result<T，std::io:: Error> 
很 常见 〈 常 见于 涉及 IO 操作 的 函数 )， 所 以 Rust 标准 库 为 它 定义 了 一 个 简写 语法 。 在 
std: :io 模块 中 ， 有 如 下 定义 : 


// std::io::Error 类 型 
struct Error { ... }; 








// std::io::ResuLt 类 型 ， 等 价 于 通常 的 ResutLt， 
// 但 专门 以 std: :io::Error 作 为 错误 类 型 
type ResuLt<T> = std::result::Result<T, Error> 























大 
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如 果 使 用 std: :io: :Result 声明 把 以 上 定义 引入 作用 域 ， 那 么 write_image 的 返回 类 型 就 可 
以 写成 更 简短 的 Result<>。 这 种 简写 形式 在 你 阅读 std: :to、std::fs 和 其 他 地 方 中 国 数 的 


文档 时 经 常 可 以 看 到 。 














2.6.6 ”并 发 的 曼 德 布 洛 特 程 序 


最 后 ， 所 有 逻辑 已 经 各 就 各 位 ， 接 下 来 要 考虑 main 函数 了 ， 此 时 可 以 利用 并 发 提升 性 能 。 


首先 来 看 一 看 非 并 发 版 本 ， 比 较 简 单 : 


use std::io::Write; 


fn main() { 
let args: Vec<String> 


if args.len() != 5 { 
writeln!(std::io: 





= std::env::args().collect(); 


:stderr(), 


"Usage: mandelbrot FILE PIXELS UPPERLEFT LOWERRIGHT") 


.Unwrap(); 
writeln!(std::io: 
"Example 
args[0]) 
.Unwrap(); 


:stderr(), 
: {} mandel.png 1000x750 -1.20,0.35 -1,0.20", 


std::process: :exit(1); 


Let bounds = parse_pair(&args[2], 'x') 
.expect("error parsing image dimensions"); 

Let upper_left = parse_complex(&args[3]) 
.expect("error parsing upper left corner point"); 

Let Lower_right = parse_complex(&args[4]) 
.expect("error parsing lower right corner point"); 


Let mut pixels = vec![0; bounds.0 * bounds.1]; 


render(&mut pixels, bounds, upper_left, lower_right); 


write image(&args[1], 


&pixels, bounds) 


.expect("error writing PNG file"); 


收集 命令 行 参数 ， 保 存 到 一 个 String 向量 中 。 然 后 逐个 解析 它们 并 开始 计算 。 


Let mut pixels = vec![0; bounds.0 * bounds.1]; 


宏 调 用 vec![v; n] 会 创建 一 个 n 元 素 长 的 向 量 ， 每 个 元 素 的 初始 值 都 是 v。 因 此 前 画 








的 代 








码 会 创建 一 个 元 素 都 为 0 的 向 量 ， 长 度 为 bounds.8 * bounds.1， 其 中 bounds 是 解析 命令 

















行 参数 得 到 的 图 像 分 辨 素 。 如 图 2-5 所 示 ， 我 们 会 把 这 个 向 量 作为 一 个 矩形 数组 ， 保 存 1 
字 节 大 小 的 灰 度 像素 值 。 
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bounds .0 


第 1 行 : pixels[9 .. bounds.0 - 1] 


pixels 


bounds.1 


最 后 一 个 像素 : pixels[bounds.0*bounds.1 - 











图 2-5: 使 用 向 量 作 为 矩形 的 像素 数组 
接 下 来 的 关键 代码 是 : 


render(&mut pixels, bounds, upper_left, lower_right); 

















这 是 调用 render 函数 来 实际 计算 图 像 。 表 达 式 &mut pixels 借用 了 像素 缓冲 区 的 一 个 可 修改 
的 引用 ， 允 许 render 用 计算 得 到 的 灰 度 值 填充 它 ， 这 一 切 都 是 在 pixels 还 是 这 个 向 量 所 有 
者 的 前 提 下 进行 的 。 接 下 来 传人 的 参数 决定 图 像 的 尺寸 和 我 们 选择 绘制 的 复 平面 矩形 。 


write image(&args[1], &pixels, bounds) 
.expect("error writing PNG file"); 


最 后 ， 把 像素 缓冲 区 的 数据 以 PNG 文件 的 形式 写 到 磁盘 上 。 这 里 传 入 的 是 对 缓冲 区 的 一 
个 共享 (不 可 修改 ) 引用 ， 因 为 write_image 不 需要 修改 缓冲 区 的 内 容 。 


要 把 整个 计算 分 散 到 多 个 处 理 器 ,最 自然 的 方式 是 把 图 像 分 成 几 块 ， 一 个 处 理 器 负责 


块 ， 并 让 每 个 处 理 器 为 分 配给 它 的 像素 着 色 。 为 简单 起 见 ， 我 们 把 图 像 切 分 成 水 平 的 长 
条 ， 如 图 2-6 所 示 。 在 所 有 处 理 器 完成 计算 之 后 ， 就 可 以 把 像素 写 入 磁盘 了 。 
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第 1 个 线程 演 染 | rows_per_band 


第 2 个 线程 泻 染 


























pixels 





bounds.1 

















三 个 线程 泻 染 最 后 一 条 的 高 度 可 能 


最 后 小 于 rows_per_band 























图 2-6: 把 像素 缓冲 区 分 成 长 条 ， 以 便 并 行 泻 染 
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crossbean 包 提 供 了 很 多 实用 的 并 发 辅助 功能 ， 包 括 这 里 正好 需要 的 受 限 线程 (scoped 
thread) 。 要 使 用 它 ， 必 须 在 Cargo.toml 文件 中 添加 下 面 这 行 代码 : 


Crossbeam = "0.2.8" 
然后 ， 必 须 在 main.rs 文件 顶部 加 上 下 面 这 行 代码 : 
extern crate crossbeam; 
接 下 来 找到 调用 render 的 那 行 代码 ， 把 它 蔡 换 成 以 下 代码 : 


let threads = 8; 
Let rows_per_band = bounds.1 / threads + 1; 























{ 
let bands: Vec<&mut [u8]> = 
pixels.chunks_mut(rows_per_band * bounds.0).collect(); 
crossbeam: :scope(|spawner| { 
for (i, band) in bands.into iter().enumerate() { 
let top = rows_per_band * i; 
Let height = band.len() / bounds.0; 
Let band_bounds = (bounds.0, height); 
Let band_upper_Left = 
pixel_to_point(bounds, (0, top), upper_left, lower_right); 
Let band_lower_right = 
pixel_to_point(bounds, (bounds.0, top + height), 
upper_left, lower_right); 
spawner .spawn(move || { 
render(band, band_bounds, band_upper_left, band_lower_right); 
]); 
} 
1 
} 


像 以 前 一 样 ， 一 步 一 步 来 分 析 : 


let threads = 8; 
Let rows_per_band = bounds.1 / threads + 1; 


这 里 声明 了 要 使 用 8 个 线程 ”。 之 后 又 计算 了 每 一 条 应 该 包含 多 少 像素 行 。 因 为 每 一 条 的 
高 度 是 rows_per_band， 而 整个 图 像 的 总 宽度 是 bounds .09， 所 以 长 条 区 域 的 像素 数量 就 是 
rows_per_band * bounds.0。 为 了 保证 所 有 条 加 起 来 可 以 覆盖 整个 图 像 ， 我 们 给 行 数 加 1， 
以 免 受 高 度 不 能 被 线程 数 (threads) 整除 的 影响 。 


Let bands: Vec<&mut [u8]> = 
pixels.chunks_mut(rows_per_band * bounds.0).collect(); 


这 里 把 像素 缓冲 区 分 成 了 长 条 。 缓 冲 的 chunks_mut 方法 返回 一 个 迄 代 器 ， 可 以 产生 可 修 


改 、 不 重 且 的 缓冲 区 切片 ， 其 中 每 个 切片 包含 rows_per_band * bounds.6 个 像素 。 换 句 
话说 ， 也 就 是 有 rows_per_band 个 完整 的 像素 行 。chunks_mut 产生 的 最 后 一 个 切片 包含 的 





















































is 





前 系统 上 可 








注 2: num_cpus 包 提 供 了 一 个 函数 ， 返 的 CPU 数量 。 
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行 数 较 其 他 切片 可 能 会 少 一 些 ， 但 每 一 行 包含 的 像素 数 是 相同 的 。 最 后 ， 这 个 和 迭代 器 的 
collect 方法 会 构建 一 个 向 量 ， 用 于 保存 这 些 可 修改 、 不 重合 的 切片 。 


现在 可 以 使 用 crossbean 库 了 : 


crossbeam: :scope(|spawner| { ... }); 


参数 |spawner| { ... } 是 一 个 Rust 闭 包 (closure) 表达 式 。 闭 包 就 是 一 个 可 以 被 当 作 函 
数 调用 的 值 。 在 此 ，|spawner| 是 参数 列表 ， 而 { ... } 就 是 函数 体 。 注 意 ， 跟 使 用 fn 声 
明 的 函数 不 同 ， 不 需要 声明 闭 包 的 参数 类 型 ，Rust 会 推断 闭 包 的 参数 以 及 返回 值 的 类 型 。 


在 这 里 ，crossbeam: :scope 调用 了 这 个 闭 包 ， 并 传 给 spawner 参数 一 个 值 ， 以 便 闭 包 可 以 
通过 它 来 创建 新 线程 。crossbeam: :scope 图 数 会 等 待 所 有 线程 都 执行 完成 后 再 返回 自身 。 
这 样 ，Rust 就 可 以 确定 这 些 线程 在 超出 作用 域 之 后 ， 不 会 再 访问 它们 对 应 的 pixels 的 部 
分 ， 同 时 也 让 我 们 知道 当 crossbeam: :scope 返回 ， 就 意味 着 图 像 的 计算 完成 了 。 


for (i, band) in bands.into iter().enumerate() { 


这 行 代 码 是 在 友 代 像素 缓冲 区 的 长 条 。into_iter() 迭代 器 会 给 予 每 次 迭代 的 循环 体 对 一 
个 切片 的 专 一 所 有 权 ， 确 保 每 次 只 有 一 个 线程 可 以 对 其 执行 写 操作 。 具 体 细 市 将 在 第 5 章 
介绍 。 然 后 ，enumerate 适配器 会 产生 元 组 ， 包 含 每 一 个 向 量 元 素 及 其 索引 。 
Let top = rows_per_band * i; 
Let height = band.Len() / bounds.0; 
Let band_bounds = (bounds.0, height); 
Let band_upper_Left = 
pixel_to_point(bounds, (0, top), upper_left, lower_right); 
let band_lower_right = 
pixel_to_point(bounds, (bounds.0, top + height), 
upper_left, lower_right); 


基于 索引 和 每 个 长 条 的 实际 大 小 〈 别 忘 了 最 后 一 个 可 能 比 其 他 的 短 )， 可 以 按照 render 国 
数 的 要 求 ， 计 算出 一 个 定 界 盒 子 ， 这 个 盒子 只 对 应 缓冲 区 中 的 当前 长 条 ， 而 非 整个 图 像 。 
类 似 地 ， 我 们 再 利用 pixel_to_point 函数 找到 对 应 复 平面 的 左上 角 和 右 下 角 。 


spawner.spawn(move || { 
render(band, band_bounds, band_upper_left, band_lower_right); 


]); 


最 后 ， 创 建 一 个 线程 ， 运 行 闭 包 move || { ... }。 这 个 语法 看 起 来 有 点 怪 ， 其 实 这 是 专门 
给 函数 体 为 { ... } 但 没有 参数 的 闭 包 设计 的 。 前 头 的 move 关键 字 表示 这 个 闭 包 会 取得 它 
所 使 用 变量 的 所 有 权 。 特 别 注意 ， 只 有 这 个 闭 包 可 能 会 用 到 可 修改 的 切片 band。 

如 前 所 述 ，crossbeam: :scope 调用 会 确保 所 有 线程 在 它 返回 前 完成 ， 也 就 是 说 只 要 它 返 回 
了 ， 就 可 以 把 图 像 写 入 文件 了 。 


2.6.7 ”运行 曼 德 布 洛 特 绘图 器 
我 们 的 程序 使 用 了 几 个 外 部 包 : num 用 于 复数 运算 ，image 用 于 写 PNG 文件 ，crossbeam 用 
于 创建 受 限 的 线程 。 以 下 就 是 包含 所 有 依赖 的 最 终 的 Cargo.toml 文件 : 







































































大 
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[packag 
name = 
version 


e] 


"mandelbrot" 
= "0,1.0" 
authors = ["You <you@example.com>"] 


[dependencies] 
crossbeam = "0.2.8" 
image = "0.13.0" 
num = "0.1.27" 


配置 好 这 些 依赖 就 可 以 运行 程序 了 : 


$ cargo build -- 


reLease 


Updating registry ‘https://github.com/rust-lang/crates.io-index. 
Compiling bitflags vO.3.3 


Compiling png vO.4.3 

Compiling image vO.13.0 

Compiling mandelbrot v0.1.0 (file:///home/jimb/rust/mandelbrot) 

Finished release [optimized] target(s) in 42.64 secs 

$ time target/release/mandelbrot mandel.png 4000x3000 -1.20,0.35 -1,0.20 
QOm1.750s 
0m6 .205s 
0m0.026s 


real 
user 
sys 


$ 


这 里 使 用 Unix 的 time 命令 
理 器 时 间 ， 但 实际 运行 时 间 小 于 两 秒 。 























输出 了 程序 的 运行 时 间 。 注 意 ， 尽 管 计算 图 像 花 了 6 秒 多 的 处 
可 以 验证 一 下 ， 实际 运行 时 间 大 部 分 花 在 了 写 


图 像 





上 面 ， 只 要 把 相关 代码 注释 掉 就 可 以 了 。 在 我 们 测试 这 个 程序 的 笔记 本 计算 机 上 ， 这 个 并 











0 


上 改进 这 个 程 
运行 程序 后 应 该 会 


曼 德 布 洛 特 计 算 时 间 几 乎 减少 为 原来 的 四 分 之 一 。 
E 序 。 























F 它 。 如 有 果 一 切 顺利 ， 


创建 一 个 名 为 mandel.png 的 文件 ， 你 可 以 用 自己 的 图 





第 19 章 将 展示 女 

















I 何 从 根本 


片 查看 程序 或 Web 





应 该 可 以 看 到 类 似 图 2-7 所 示 的 结果 。 











i 











图 2-7: 并 行 


时 德 
J 有 概 保 


洛 特 程序 运行 


了 的 结果 
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2.6.8 ”安全 无 形 
最 后 ， 这 个 并 行程 序 可 能 跟 用 其 他 语言 编写 的 没有 本 质 区 别 。 它 们 都 是 把 像素 缓冲 区 分 成 


片 ， 
了 了 5 


交 给 多 个 处 理 器 去 计算 ， 每 个 处 理 器 各 自 完成 自己 的 计算 ,等 到 所 有 处 理 器 都 完成 
再 展示 结果 。 那 么 Rust 对 并 发 编程 的 支持 有 什么 特别 之 处 ? 





要 知道 ， 这 里 没有 展示 的 是 用 Rust 根本 写 不 出 来 的 程序 。 我 们 在 本 章 看 到 的 代码 做 到 了 把 





组 


Rust 编译 器 的 静态 检查 不 会 放 过 其 中 任何 一 种 写法 。C 或 C++ 编译 器 会 兴致 勃勃 地 帮 你 在 








Ph 区 正确 分 配给 线程 ， 但 也 有 很 多 其 他 可 能 的 写法 做 不 到 (因而 会 导致 数据 争 用 )。 但 








无 起 的 程序 空间 里 大 海 捞 针 般 地 寻找 细微 的 数据 争 用 人 逻辑 ， 但 Rust 会 提前 告诉 你 哪里 可 能 
会 出 问题 。 

第 4 章 和 第 5 章 将 介绍 Rust 的 内 存 安全 规则 。 第 19 章 会 解释 这 些 规 则 如 何 确保 并 发 可 靠 。 
但 为 了 理解 这 些 ， 还 需要 先 掌握 关于 Rust 基本 类 型 的 知识 ， 而 这 正 是 下 一 章 的 内 容 。 





第 3 章 


基本 类 型 





世界 上 的 书 有 很 多 很 多 种 类 型 ， 这 是 合理 的 ， 因 为 世界 上 的 人 也 有 很 多 很 多 种 类 
型 ， 每 个 人 都 想 看 到 不 同 的 东西 。 
一 一 Lemony Snicket (美国 作家 及 编剧 Daniel Handler 的 笔名 ) 

Rust 的 类 型 服务 于 3 个 目的 。 
口 安全 

通过 检查 程序 的 类 型 ，Rust 编译 器 可 以 防止 各 种 常见 错误 。 通 过 将 空 指针 和 未 经 检查 

的 联合 (union) 替换 成 类 型 安全 的 特性 ，Rust 甚至 可 以 消除 很 多 错误 ， 而 这 些 错 误 在 
其 他 语言 中 常 笛 是 导致 参 溃 的 根源 。 
口 效率 

程序 员 对 Rust 程序 如 何 表示 内 存 中 的 值 可 以 进行 非常 细 粒 度 的 控制 ， 可 以 选择 他 们 知 

道 处 理 器 将 会 高 效 处 理 的 类 型 。 程 序 无 须 因 自己 用 不 到 的 通用 性 或 灵活 性 而 折 中 。 
口 简洁 

程序 员 只 需 在 代码 中 写 出 类 型 ，Rust 就 可 以 全 权 负 责 而 无 须 过 多 提示 。Rust 程序 在 类 

型 方面 通常 比 C++ 程序 更 清晰 。 
Rust 在 设计 时 没有 考虑 解析 器 或 即时 (JIT，Just In Time) 编译 器 ， 而 是 选择 了 事先 编译 。 
换 名 话说，Rust 程序 在 执行 之 前 会 完全 被 转换 为 机 器 码 。Rust 的 类 型 有 助 于 事前 编译 器 为 
程序 要 操作 的 值 选 择 更 好 的 机 器 级 表示 ， 这 些 表 示 形 式 的 性 能 是 可 预期 的 ， 因 而 程序 员 可 
以 完全 利用 机 器 的 能 
Rust 是 静态 类 型 的 语言 ， 即 无 须 实际 运行 程序 ， 编 译 器 就 可 以 检查 所 有 可 能 的 执行 路 径 ， 
确保 程序 以 与 类 型 一 致 的 方式 使 用 每 一 个 值 。 为 此 Rust 可 以 提前 捕捉 到 很 多 编程 错误 ， 而 
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这 也 是 Rust 安全 保障 的 关键 。 


与 JavaScript 或 Python 等 动态 类 型 语言 相 比 ，Rust 要 求 写 代码 之 前 多 做 一 些 规划 : 要 写 出 
国 数 参数 及 返回 值 的 类 型 、 结 构 体 成 员 的 类 型 ， 以 及 其 他 一 些 结构 体 的 类 型 。 然 而 ， 实 际 
上 并 没有 你 想象 得 那么 麻烦 ， 因 为 Rust 提供 了 两 个 特性 。 


。 Rust 可 以 根据 你 写 出 的 类 型 推断 其 余天 部 分 值 的 类 型 。 实 践 中 ,对 于 某 个 变量 或 表达 式 ， 
通常 只 有 一 种 类 型 适用 。 此 时 ，Rust 允许 我 们 忽略 这 种 类 型 。 比 如 ， 可 以 像 下 面 这 样 写 
出 函数 中 所 有 值 的 类 型 . 


fn build vector() -> Vec<i16> { 
let mut Vv: Vec<i16> = Vec::<i16>::new(); 
v.push(10116); 
v.push(20i16); 
V 
































} 


但 这 样 显 得 很 乱 ， 也 有 很 多 重复 。 根 据 函 数 的 返回 值 类 型 ， 显 然 v 的 类 型 一 定 是 Vec<i16>， 
即 一 个 包含 16 位 有 符号 整数 的 向 量 ， 其 他 任何 类 型 都 不 对 。 那 么 接着 ， 这 个 向 量 的 每 
个 元 素 一 定 是 116。 这 实际 上 也 是 Rust 类 型 的 工作 原理 ， 因 此 你 可 以 这 样 写 : 
fn build vector() -> Vec<i16> { 

Let mut Vv = Vec::new(); 

v.push(10); 

v.push(20); 

V 














} 


这 两 个 函数 定义 完全 等 价 ， 无论 怎么 写 ，Rust 生成 的 机 器 码 都 是 一 样 的 。 类 型 推断 带 
来 了 动态 类 型 语言 才 有 的 可 读 性 ， 同 时 又 能 保证 在 编译 时 捕获 错误 。 


函数 可 以 是 泛 型 的 。 如 果 函 数 的 目的 和 实现 足够 通用 ， 那 可 以 将 它 定 义 为 符合 必要 标准 
的 任何 类 型 集 。 这 样 一 个 定义 就 能 涵盖 无 限 种 使 用 场景 。 

在 Python 或 JavaScript 中 ， 所 有 函数 天 生 可 用 于 任意 类 型 。 只 要 给 定 的 值 拥 有 函数 运行 
所 需 的 属性 和 方法 ， 那 它 就 能 使 用 这 个 国 数 。( 这 个 特点 通常 被 称 为 鸭子 类 型 : 如果 叫 
起 来 像 胸 子 ， 走 路 也 像 蝎 子 ， 那 它 就 是 鸭子 。) 然而 正 是 这 种 灵活 性 才 导 致 这 些 语 言 不 
能 提前 检查 出 类 型 错误 ， 要 捕获 这 种 错误 只 能 靠 测 试 。 

Rust 的 泛 型 函数 为 这 门 语言 增添 了 一 定 程度 的 灵活 性 ， 同 时 还 能 保证 在 编译 时 捕获 所 
有 类 型 错误 。 

不 仅 灵活 ， 泛 型 函数 还 跟 对 应 的 非 泛 型 函数 一 样 高 效 。 第 11 章 将 详细 讨论 泛 型 函数 。 


本 章 剩 下 的 内 容 将 自 下 而 上 地 介绍 Rust 的 类 型 ， 从 整数 和 浮 点 值 等 简单 的 机 器 类 型 开始 ， 
然后 再 介绍 如 何 将 它们 合成 为 更 复杂 的 结构 。 必 要 时 也 会 讨论 Rust 如 何在 内 存 中 表示 这 些 
值 ， 以 及 它们 的 性 能 特点 。 


表 3-1 总 结 了 Rust 中 的 所 有 类 型 ， 既 有 Rust 的 基本 类 型 ， 也 有 标准 库 中 极为 常用 的 类 型 ， 
还 有 一 些 用 户 定义 类 型 的 例子 。 














表 3-1: Rust 的 类 型 
类 型 


说 明 


值 





i8、i16、i32、i64、 
u8、Uu16、Uu32、Uu64 


isize、Uusize 


f32、f64 

bool 

char 

(char, u8, i132) 
0 


struct S { x: f32， 
y: f32 } 


struct T(i32, char); 
struct Es; 


enum Attend { OnTime, 
Late(u32)} 


Box<Attend> 


&i32、&mut i32 


String 


&str 


[f64; 4]、[u8; 256] 


Vec<f64> 


&[u8]、&mut [u8] 


&Any、&mut Read 


fn(&str, usize) -> isize 


( 闭 包 类 型 没有 书面 形式 ) 





给 定位 宽 的 有 符号 和 无 符号 整数 


与 机 器 字 (32 位 或 64 位) 同样 大 
的 有 符号 和 无 符号 整数 

单 精度 、 双 精度 IEEE 浮 点 数值 
布尔 值 

Unicode 字符 ，32 位 宽 

元 组 ， 允 许 混合 类 型 

“ 基 元 ”( 空 ) 元 组 

命名 字段 结构 体 





类 元 组 结构 体 
类 基 元 结构 体 ， 无 字段 
枚 举 ， 或 代数 数据 类 型 


Box: 拥有 指向 堆 中 值 的 指针 
共享 和 可 修改 的 引用 : 非 所 有 型 指 
针 ， 生 命 期 不 能 超过 引用 的 值 

UTF-8 字符 串 ， 动 态 分 配 大 小 

对 str 的 引用 : 对 UTF-8 文本 的 非 
所 有 型 指针 
数组 ， 固 定 长 度 ， 元 素 类 型 都 相同 






































向 量 ， 可 变 长 度 ， 元 素 类 型 都 相同 
对 切片 ， 即 数组 或 向 量 某 一 部 分 的 
引用 ， 包 含 指针 和 长 度 

特 型 对 象 ， 对 任何 实现 了 一 组 给 定 
方法 的 值 的 引用 

函数 指针 

闭 包 





42、-5i8、Qx400u16、00100i16、20_922_ 


789_888_000u64、b'*' (u8 字 节 字 


137、-0b0101_0010isize、 
Oxffff_fcOQusizez 


1.61803、3.14f32、6.0221e23f64 
true、 false 
Wn 
('%', Ox7f, -1) 
(0) 

Ss { x: 120.0, y: 209.0} 


th 
E 


Attend: :Late(5)、Attend: :OnTime 


Box: :new(Late(15)) 


&s.y、&mut v 
"3—X7 : ramen".to_string() 
"过 祭 : soba"、&s[0..12] 


[1.0, 0.0, 0.0, 1.0]、 
[pb "3 2561] 
vec![0.367, 2.718, 7.389] 


&v[10..20]、&mut a[..] 


value as &Any、 
&mut file as &mut Read 


i32::saturating_add 


la, bl a*a+b*b 


表 3-1 中 的 大 多 数 类 型 会 在 本 章 介绍 ， 其 他 类 型 将 分 章 介绍 ; 
。 struct 类 型 将 在 第 9 章 单独 介绍 ， 
。 枚 举 类 型 将 在 第 10 章 单独 介绍 ， 
。 特 型 对 象 会 放 在 第 11 章 介绍 ; 

。 本 章 介绍 string 和 &str 的 基本 内 容 ， 更 多 细节 会 在 第 17 章 介 绍 ， 
。 函 数 和 闲 包 类 型 会 在 第 14 章 介绍 。 
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3.1 机 器 类 型 


Rust 类 型 的 基础 是 一 组 固定 宽度 的 数值 类 型 (与 儿 乎 所 有 现代 处 理 器 直接 在 硬 们 














类 型 对 应 )， 以 及 布尔 类 型 和 字符 类 型 。 





中 实现 的 


Rust 数值 类 型 的 命名 遵循 一 种 规律 ， 即 要 同时 写 出 位 宽 及 其 表现 形式 ， 如 表 3-2 所 示 。 


表 3-2: 数值 类 型 
大 小 (位 ) 无 符号 整数 。 有 符号 整数 。 浮 点 数值 





8 u8 i8 

16 u16 i16 

32 WBZ i32 fF32 
64 u64 i64 f64 
机 器 字 usize isize 


3.1.1 整数 类 型 
Rust 的 无 符号 整数 类 型 使 用 所 有 位 表示 正 值 和 零 ， 如 表 3-3 所 示 。 
表 3-3: 无 符号 整数 





类 型 范 

u8 0 到 2-1 (0 到 255) 

u16 0 到 2 -1 (0 到 65 535) 

u32 0 到 2”-1 (0 到 4294 967 295) 

064 0 到 2“-1 (0 到 18 446 744 073 709 551 615 或 1844 京 ) 
usize 0 到 ?22 1 或 29 1 








Rust 的 有 符号 整数 使 用 2 的 补 数 的 表示 形式 ， 使 用 与 无 符号 类 型 相同 的 位 模式 表示 相应 范 


围 的 正 数 和 负数 ， 如 表 3-4 所 示 。 
表 3-4: 有 符号 整数 





并 ”型 范 

i8 -2 7 到 2-1 (-128 到 127) 

i16 -2 到 22-1 (-32768 到 32 767) 

i32 -22 到 23-1 (-2 147 483 648 到 2 147 483 647) 

i64 -2° 到 2%-_1 (-9 223 372 036 854 775 808 到 9 223 372 036 854 775 807) 
isize 21 到 23-1 或 -2 到 2%-1 








Rust 通常 使 用 u8 类 型 表示 字 节 值 。 比 如 ， 从 文件 或 套 接口 读 取 数据 拿 到 的 是 u8 值 数 据 流 。 


与 C 和 C++ 不同 ，Rust 会 将 字符 和 数值 类 型 区 别 对 待 ， 即 char 既 不 是 u8 也 不 是 
节 将 介绍 Rust 的 char 类 型 。 


18。3.1.4 





可 以 将 usize 和 isize 看 作 C 和 C++ 中 的 sizet 和 ptrdiff_ t。usize 无 符号 ，isize 有 符 
号 。 它 们 的 精度 取决 于 目标 机 器 的 寻 址 空间 大 小 : 在 32 位 机 器 上 是 32 位 长 ， 在 64 位 机 
器 上 是 64 位 长 。Rust 要 求 数组 索引 必须 是 usize 值 。 另 外 ， 表 示 数 组 或 向 量 的 大 小 ， 或 
者 某 些 数据 结构 中 元 素数 量 的 值 通 党 也 是 usize 类 型 的 。 


在 调试 构建 中 ，Rust 会 检查 算术 操作 中 是 否 有 整数 溢出 : 
let big val = std::i32::MAX; 
Let x = big_val + 1; // 许 异 : 算术 操作 谥 出 
在 发 布 构建 中 ， 这 个 加 法 操作 会 翻转 (wrap) 为 负 值 〈 与 C++ 不 同 ，C++ 中 的 有 符号 整数 
溢出 是 未 定义 行为 )。 但 除非 你 永远 不 想 使 用 调试 构建 ， 否 则 不 要 指望 这 个 行为 。 如 果真 
想 翻转 计算 结果 ， 那 么 可 以 使 用 对 应 的 方法 : 


Let x = big_val.wrapping_add(1); // 没 问 题 


Rust 中 的 整数 字面 量 可 以 通过 一 个 后 级 表示 类 型 ， 比 如 42u8 是 一 个 u8 值 ， 而 1729isize 
是 一 个 isize。 如 果 整 数字 面 量 中 不 包含 类 型 后 级 ，Rust 则 会 根据 上 下 文 推断 其 类 型 。 推 
断 通常 会 找到 一 种 唯一 类 型 ， 但 有 时 候 也 存在 多 种 类 型 均 可 的 情况 。 此 时 ， 如 果 可 能 的 类 
型 中 有 i132， 那么 Rust 将 默认 其 为 132。 否 则 ，Rust 会 因 存 在 歧义 而 报错 。 

另外 ， 整 数字 面 量 可 以 使 用 前 级 9x、9o 和 9b 分 别 表示 十 六 进 制 、 八 进 制 和 二 进 制 。 

为 了 让 长 数值 更 容易 认 读 ， 可 以 在 数字 间 插 入 下 划 线 。 比 如 ， 可 以 把 最 大 的 u32 值 写成 
4_294_967_295。 在 哪里 插入 下 划 线 都 无 所 谓 ， 因 此 对 于 十 六 进 制 或 二 进 制 数值 ， 也 可 以 每 
4 位 插 一 个 下 划 线 ， 比 如 9xffff_ffff。 或 者 ， 也 可 以 用 下 划 线 将 数字 与 类 型 后 组 分 开 ， 比 
如 127_u8。 

表 3-5 列举 了 几 个 整数 字面 量 的 示例 。 

表 3-5: 整数 字面 量 






























































字面 量 类 型 十 进 制 值 
116i8 i8 116 
Qxcafeu32 U32 51 966 
9b6010_1010 推断 42 

0o106 推断 70 


尽管 数值 类 型 和 char 类 型 不 一 样 ， 但 Rust 还 是 提供 了 字 节 字面 量 (byte literal) ， 即 用 类 
字符 字面 量 表示 的 u8 值 : b'x' 表示 ASCII 编码 的 字符 X， 它 是 一 个 u8 值 。 比 如 ， 由 于 
字符 A 的 ASCII 编码 是 65， 因 此 b'A' 等 于 65u8。 字 节 字 面 量 中 只 能 出 现 ASCII 编码 的 
字符 。 

有 几 个 ASCII 编码 的 字符 在 以 字 节 字面 量 表 示 时 需要 特殊 处 理 ， 不 能 像 对 待 其 他 字符 一 样 
简单 地 将 其 放 在 单 引 号 后 面 ， 否 则 可 能 导致 歧义 或 者 难以 分 辨 。 表 3-6 列 出 了 这 几 个 字符 ， 
在 通过 字 节 字面 量 表示 时 ， 需 要 在 它们 前 面 加 一 个 反 斜 杠 。 
































及 
讨 
并 
己 
名 


表 3-6: 需要 转 义 的 字符 

















字 符 字符 字面 量 对 等 的 数值 
单 引号 (') 车 39u8 
反 斜 杠 (\) b'\\ 92u8 
换行 b'\n' 10u8 
可 车 b'\r' 13u8 
制 表 符 b'\t' 9u8 














对 于 难 写 或 难 读 的 字符 ， 可 以 用 十 六 进 制 写 出 它们 的 编码 。 在 b'\xHH' 形式 的 字 节 字面 量 
中 ，HH 是 两 位 十 六 进 制 数字 ， 表 示 其 数值 为 HH 的 字 节 。 比 如 ,，“ 转 义 ” 控 制 字符 的 ASCII 
编码 是 27， 即 十 六 进 制 的 1， 因此 可 以 用 b'\x1b' 这 个 字 市 字面 量 表示 它 。 因 为 字 市 字面 
量 只 是 u8 值 的 另 一 种 写法 ， 所 以 在 使 用 它 以 前 有 必要 想 一 想 : 直接 使 用 简单 的 数值 字面 


















































量 是 不 是 更 好 ? 像 刚 才 那 个 例子 ， 使 用 b'\x1b' 而 不 是 更 简单 的 27， 唯 一 的 理由 应 该 是 你 
想 强 调 这 个 值 表示 一 个 ASCII 编码 。 





可 以 使 用 as 操作 符 实现 整数 类 型 之 间 的 转换 。 类 型 转换 的 细 方 会 在 6.13 市 介绍 ， 现 在 先 
来 看 儿 个 例子 吧 : 


assert eq!( 10 i8 as u16, 10_u16); // 在 范围 内 
assert_eq!( 2525_u16 as i16, 2525_i16); // 在 范围 内 


























assert eq!( -1 i16 as i32, -1_i32); // 以 符号 填充 
assert_eq!(65535_u16 as i32，65535_i32); // 以 零 填 充 











// 超出 目的 类 型 范围 的 转换 会 得 到 原始 值 对 2 的 N 次 方 取 模 后 的 值 ， 
// 其 中 N 是 目的 类 型 的 位 宽 。 这 种 情况 也 被 称 为 “ 截 短 ” 
assert eq!( 1000 i16 as U8, 232_uy8); 




















assert_eq!(65535_uy32 as i16, -1_i16); 
assert eq!( -1 i8 as u8, 255_u8); 
assert eq!( 255_u8 as i8, -1_i8); 


与 其 他 值 一 样 ， 整 数 也 可 以 有 方法 。 标 准 库 提供 了 一 些 可 以 通过 在 线 文档 了 解 的 基本 操 
作 。 注 意 ， 文 档 中 既 包 含 类 型 自身 的 页 面 ( 比 如 ， 搜 索 “i32 (primitive type)”)， 也 包含 该 
类 型 对 应 模块 的 页 面 (搜索 “std: :i32”)。 比 如 : 

assert_eq!(2u16.pow(4), 16); // 乘 方 

assert eq!((-4i32).abs(), 4); // 绝对 值 

assert_eq!(9b101101u8 .count_ones()，4); // 数量 统计 
这 儿 个 例子 中 的 类 型 后 级 是 必需 的 ， 因 为 如 果 没 有 类 型 ，Rust 就 没 法 找到 这 个 值 的 方法 。 
不 过 在 实际 的 代码 中 ， 通 常会 有 上 下 文 帮助 确定 类 型 ， 因 而 就 不 需要 这 些 后 级 了 。 


3.1.2” 浮 点 类 型 
Rust 支持 IEEE 单 、 双 精度 浮 点 类 型 。 遵 循 IEEE 754-2008 标准 ， 这 些 类 型 包含 正 、 负 无 
穷 ， 区 分 正 、 负 零 ， 还 有 一 个 非 数值 (not-a-number) 值 ， 如 表 3-7 所 示 。 















































表 3-7: 浮 点 类 型 








类 型 精 度 范围 
f32 IEEE 单 精度 (至少 6 位 小 数 ) 约 -3.4x10”* 到 3.4x10” 
f64 IEEE 双 精 度 (至 少 15 位 小 数 ) 约 -1.8x10* 到 1.8x10%* 





Rust 的 f32 和 f64 对 应 支持 IEEE 浮 点 值 实现 的 C 和 C+t+ 中 的 float 和 double 类 型 ， 以 及 
Java 中 的 float 和 double 类 型 ，Java 始终 支持 IEEE 浮 点 值 。 


3-1 展示 了 序 点 字面 量 的 通用 形式 .。 





小 数 部 分 类 型 后 级 
一 人 一 ~ 人 ~ 
31415.926e-4f64 


pe a 
整数 部 分 指数 











3-1: 浮 点 字面 量 


序 点 数值 中 除了 整数 部 分 ， 其 他 部 分 都 是 可 选 的 ， 但 小 数 部 分 、 指 数 和 类 型 后 缀 这 三 者 中 
至 少 要 有 一 个 存在 ， 这 样 才 角 ee 区 分 开 。 小 数 部 分 也 可 以 只 有 一 个 小 数 
点 ， 因 此 5. 也 是 一 个 有 效 的 浮 点 常 


如 果 浮 点 字面 量 中 没有 类 型 后 级 ， 那 么 Rust 会 根据 上 下 文 推断 它 是 f32 还 是 f64， 如 果 两 
种 都 有 可 能 ， 则 默认 为 f64。( 类 似 地 ，C、C++ 和 Java 都 将 不 带 后 缀 的 浮 点 字面 量 当 作 
double 值 处 理 。) 为 了 进行 类 型 推断 ，Rust 将 整数 字面 量 和 浮 点 字面 量 看 成 两 种 不 同 的 类 
型 。 换 名 话说 ， 浮 点 类 型 不 会 被 推断 为 整数 类 型 ， 反 之 亦 然 。 

表 3-8 给 出 了 一 些 浮 点 字面 量 的 示例 。 


表 3-8: 浮 点 字面 量 





















































字 面 量 类 型 数 学 值 

-1.5625 推断 —(1%/6) 

2. 推断 2 

0.25 推断 1/4 

1e4 推断 10 000 

40f32 f32 40 
9.109_383_56e-31f64 f64 约 9.109 383 56x10” 


标准 库 的 std::f32 和 std::f64 模块 为 IEEE 要 求 的 特殊 值 定义 了 常量 ， 比 如 INFINITY、 

NEG_INFINITY ( 负 无 穷 ) 、NAN (Not A Number， 非 数值 )， 以 及 MIN 和 MAX (最 小 和 最 大 有 

0 模块 std: :f32::consts 和 std::f64: :consts 提供 了 各 种 常用 的 数学 常量 ， 比 如 E、 
I， 以 及 2 的 平方 根 等 。 


f32 和 f64 类 型 也 提供 完整 的 数学 计算 方法 ， 比 如 2f64.sqrt() 用 于 计算 2 的 双 精 度 平方 
根 。 标 准 库 文 档 在 “f32 (primitive type)” 和 “f64 (primitive type)” 条 目下 给 出 了 这 些 方法 
的 说 明 。 看 几 个 例子 : 














及 
讨 
头 
由 
上 


assert_eq!(5f32.sqrt() * 5f32.sqrt()，5.); // 根据 IEEE， 正 好 5.0 
assert_eq!(-1.01f64.fLoor()，-1.0); 
assert!((-1. / std::f32::INFINITY).is_sign_negative()); 


同样 ， 在 真实 的 代码 中 ， 通 常 不 需要 写 出 后 级 ， 因 为 根据 上 下 文 可 以 推断 出 来 。 然 而 ， 如 果 
根据 上 下 文 推断 不 出 来 ， 可 能 就 会 出 现 令 人 不 解 的 错误 。 比 如 ， 下 面 的 代码 就 无 法 编译 : 
println!("{}", (2.0).sqrt()); 


Rust 会 报错 : 


error: no method named “sqrt found for type ‘{float}. in the current scope 


这 有 点 不 太 好 理解 ， 不 在 浮 点 类 型 上 找 ， 难 道 还 到 其 他 类 型 上 去 找 sqrt 方法 吗 ? 解决 方案 
是 写 出 你 想 要 的 类 型 ， 以 下 两 种 写法 都 行 : 


println!("{}", (2.0_f64).sqrt()); 
println!("{}", f64::sqrt(2.0)); 


与 C 和 C++ 不同，Rust 几乎 不 进行 隐 式 数值 类 型 转换 。 如 果 函 数 接收 f64 参数 ， 传 入 132 
值 就 会 导致 错误 。 事 实 上 ，Rust 其 至 都 不 会 隐 式 地 将 i16 值 转换 为 132 值 ， 即 使 每 个 116 
值 也 是 i32 值 。 不 过 ， 这 里 的 关键 词 是 隐 式 。 使 用 as 操作 符 进 行 显 式 转换 是 没有 问题 的 ， 
比如 1 as f64 或 x as i32。 不 文 持 隐 式 转换 有 时 候 会 让 同样 的 Rust 代码 比 C 和 C++ 代码 
显得 喝 唆 。 然 而 ， 隐 式 整 数 转 换 经 常会 导致 bug 和 安全 漏洞 也 是 有 案 可 查 的 。 根 据 我 们 的 
经 验 ，Rust 要 求 明确 写 出 数值 类 型 转换 ， 让 我 们 多 次 避免 了 问题 。6.13 市 将 具体 解释 类 型 
转换 。 


3.1.3 布尔 类 型 


Rust 的 布尔 类 型 bool 按 惯例 有 两 个 值 ，true 和 false。== 和 < 等 比较 操作 符 都 产生 布尔 
值 ， 比如 2 < 5 是 true。 很 多 语言 在 要 求 布尔 值 的 上 下 文中 允许 使 用 其 他 类 型 值 。C 和 
C++ 会 隐 式 地 将 字符 、 整 数 、 浮 点 数 和 指针 转换 为 布尔 值 ， 因 此 这 些 类 型 的 值 可 以 直接 在 
if 或 while 语句 中 用 作 条 件 。Python 允许 在 布尔 值 上 下 文中 使 用 字符 串 、 列 表 、 字 典 ， 其 
至 集合 ， 如 果 这 些 值 不 为 室 ， 则 将 它们 视 为 true。Rust 则 非常 严格 :if 和 while 等 控制 
结构 要 求 它们 的 条 件 必须 是 bool 表达 式 ， 短 路 逻辑 操作 符 8& 和 || 同样 也 是 如 此 。 换 句 话 
说 ，if x { .…. 】} 不 正确 ， 必 须 写 成 if x != 6 { .…. } 才 行 。 


Rust 的 as 操作 符 可 以 把 boot 值 转换 为 整数 类 型 : 


assert_ eq!(false as i32, 0); 
assert eq!(true as i32, 1); 


不 过 ，as 不 会 反 向 转换 ， 即 不 能 从 数值 类 型 转换 为 布尔 值 。 此 时 ， 必 须 明确 地 写 出 可 以 返 
回 布尔 值 的 比较 表达 式 ， 比 如 x != 9。 

虽然 bool 只 需要 一 位 即 可 表示 ， 但 Rust 在 内 存 里 会 使 用 整整 一 个 字 市 作为 bool 值 ， 因 此 
可 以 创建 一 个 指向 它 的 指针 。 






























































3.1.4 字符 类 型 
Rust 的 字符 类 型 char 以 32 位 值 的 形式 表示 单个 Unicode 字符 。 


Rust 使 用 char 类 型 表示 单个 字符 ， 但 对 字符 串 或 文本 流 使 用 UTF-8 编码 。 因 此 ，String 
将 其 文本 表示 为 一 个 UTF-8 字 市 的 序列 ， 而 不 是 字符 的 数组 。 


字符 字面 量 就 是 用 单 引 号 引起 来 的 字符 ， 比 如 '8' 或 '!'。 可 以 使 用 任意 Unicode 字符 ， 
比如 ' 销 ，( 音 sabi) 是 英文 rust 对 应 的 日 本 汉字 的 char 字面 量 。 


类 似 字 市 字面 量 ， 在 字符 字面 量 中 有 儿 个 字符 也 需要 使 用 反 斜 杠 转 义 ， 如 表 3-9 所 示 。 
表 3-9: 需要 转 义 的 字符 





















































字 符 Rust 字 符 字 面 量 
单 引号 (') We 
反 斜 杠 〈\) NAN 
换行 "An' 
可 车 "Ar 
制 表 符 "NE 























如 果 愿 意 ， 也 可 以 在 单 引 号 里 写 出 相应 字符 的 十 六 进 制 Unicode 码 点 。 


。 如 果 字 符 的 码 点 范围 在 U+0000 到 U+007F 之 间 (也 就 是 对 应 的 ASCII 字符 集 )， 可 以 
将 该 字符 写成 '\xHH' 形式 ,其 中 HH 是 2 位 十 六 进 制 数 字 。 比 如 ,字符 字面 量 '*' 和 '\x2A' 
是 相等 的 ， 因 为 字符 * 的 码 点 就 是 42 或 者 十 六 进 制 的 2A。 

。 任何 Unicode 字符 都 可 写作 '\ufHHHHHH} ' ,其 中 HHHHHH 是 1 到 6 位 十 六 进 制 数字 。 比 如 ， 
字符 字面 量 '\ufCA6}' 表示 Unicode 不 赞成 表情 (Look of Disapproval) “5 怠 ” 中 用 到 
的 坎 纳 达 语 (Kannada， 印 ) 字符 “5”。 当 然 '5' 也 是 相同 的 字面 量 


里 。 
char 类 型 保存 的 Unicode 码 点 范围 只 能 在 0x0000 到 0xD7FF 之 间 ， 或 0xE000 到 0x10FFFF 
之 间 。char 不 能 是 Unicode 代理 对 中 的 某 一 半 (也 就 是 码 点 范围 不 能 在 0xD800 到 0xDFFF 
之 间 )， 也 不 能 是 Unicode 编码 空间 之 外 的 值 (也 就 是 不 能 大 于 0x10FFFF)。Rust 使 用 类 
型 系统 及 动态 检查 来 确保 char 的 值 始 终 位 于 许可 的 范围 内 。 


Rust 从 来 不 会 隐 式 地 在 char 与 其 他 类 型 之 间 进 行 转换 。 如 果 需 要 ， 可 以 使 用 转换 操作 符 
as 把 char 转换 为 整数 类 型 ， 但 如 果 目 的 类 型 小 于 32 位 ， 字 符 值 的 高 位 (upper bits) 则 会 
被 截 短 : 

assert_eq!('*' as i32, 42); 


assert eq!('s' as y16, Oxca0); 
assert_eq!('5' as i8，-0x60); // U+0CA0 被 截 短 为 8 位 有 符号 数 


而 反方 向 上 ，u8 则 是 唯一 可 以 转换 为 char 的 整数 类 型 。 因 为 Rust 希望 as 只 执行 低 开 销 、 
高 可 靠 的 转换 ， 但 除 u8 之 外 的 所 有 整数 类 型 都 可 能 包含 不 被 许可 的 Unicode 码 点 ， 所 以 
这 时 候 的 转换 还 需要 进行 运行 时 检查 。 不 过 ， 标 准 库 函 数 std: :char::from_u32 可 以 将 u32 
值 转换 为 0ption<char> 值 : 如 果 该 u32 是 不 被 许可 的 Unicode 码 点 ， 就 返回 None;， 否则 ， 
返回 Some(c)， 甚 中 <c 就 是 转换 后 的 char 值 
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标准 库 也 为 字符 提供 了 一 些 有 用 的 方法 ， 可 以 通过 在 在 线 文档 中 搜索 “char (primitive 
type)” 和 “std::char”( 模 块 ) 来 查看 。 比 如 : 

assert_eq!('*' .is_aLphabetic()，faLse); 

assert eq!('B'.is_alphabetic(), true); 

assert eq!('8'.to_ digit(10), Some(8)); 

assert_ eq!('S' .len_utf8(), 3); 

assert eq!(std::char::from digit(2, 10), Some('2')); 


单个 字符 自然 没有 字符 串 和 文本 流 那 么 有 意思 。3.5 市 将 详细 介绍 Rust 标准 的 String 类 型 
和 文本 处 理 。 


3.2 元 组 


元 组 (tuple) 由 2 个 、3 个、 4 个 …… 各 种 类 型 的 值 组 成 。 元 组 的 写法 是 把 逗号 分 隔 的 元 
素 序列 放 在 一 ee， 比如 ，("Brazil"， 1985) 是 一 个 元 组 ， 其 第 一 个 元 素 是 一 个 静 
态 分 配 的 字符 串 ， 第 二 个 元 素 是 一 个 整数 ， 它 的 类 型 是 (&str，i32) (或 者 Rust 推断 出 来 
pe el 


元 组 不 太 像 数 组 。 首 先 ， 元 组 的 每 个 元 素 都 可 以 是 一 个 不 同 的 类 型 ， 而 数组 的 元 素 必 须 都 
是 同一 类 型 。 其 次 ， 元 组 只 允许 用 常量 作为 索引 ， 比 如 t.4， 不 能 通过 t.i 或 t[i] 取得 第 
i 个 元 素 。 


Rust 代码 中 的 函数 经 常 通过 元 组 来 返回 多 个 值 。 比 如 ， 字 符 串 切片 的 split_at 方法 会 将 一 
个 字符 串 切 成 两 半 ， 然 后 返回 两 个 字符 串 ， 其 声明 如 下 : 


fn spLit_at(&seLf，mid: usize) -> (&str, &str); 


这 个 返回 类 型 (&str，&str) 就 是 一 个 包含 两 个 字符 串 切片 的 元 组 。 可 以 使 用 模式 匹配 语法 
把 这 个 方法 返回 值 的 两 个 元 素 分 别 赋值 给 不 同 的 变量 ， 

let text = "I see the eigenvalue in thine eye"; 

let (head, tail) = text.split at(21); 

assert_ eq!(head, "I see the eigenvaluye "); 

assert eq!(tail, "in thine eye"); 


以 下 是 前 面 代码 更 好 理解 的 版 本 : 


let text = "I see the eigenvalue in thine eye"; 
let temp = text.split at(21); 

let head = temp.0; 

let tail = temp.1; 

assert_eq!(head, "I see the eigenvaluye "); 
assert eq!(tail, "in thine eye'"); 


0 种 最 小 限度 的 结构 体 类 型 。 比 如 ， 在 第 2 章 曼 德 布 洛 特 程序 中 ， 我 们 

要 给 函数 传递 图 像 的 宽 和 高 ， 然 后 函数 才能 绘制 并 将 图 像 写 入 磁盘 。 为 此 可 以 声明 一 

个 包含 width 和 height 成 员 的 结构 体 ， 但 这 样 有 点 小 题 大 做 了 ， 所 以 我 们 只 传 了 一 个 
元 组 ， 





































































































/// 把 缓冲 区 中 的 pixels (大 小 由 bounds 指 定 ) 写 到 名 为 filename 的 文件 中 
fn write_image(filename: &str, pixels: &[u8], bounds: (usize, usize)) 
-> Result<(), std::io::Error> 


{ sa 
bounds 参数 的 类 型 为 (usize，usize)， 即 两 个 usize 值 的 元 组 。 没 错 ， 这 里 直接 传 一 个 
width 再 传 一 个 height 也 可 以 ， 最 终 的 机 器 码 可 能 也 差不多 。 但 这 是 一 个 怎么 写 更 清晰 的 
问题 。 我 们 认为 大 小 是 一 个 值 而 不 是 两 个 ， 元 组 恰好 可 以 表达 这 种 意图 。 
另 一 个 常用 的 元 组 类 型 可 能 会 让 人 难以 置信 ， 它 就 是 零 元 组 ()。 这 种 元 组 过 去 一 直 被 称 为 
基 元 类 型 (unit type) ， 因 为 它 只 有 一 个 值 ， 也 写作 ()。 当 不 存在 有 意义 的 值 而 上 下 文 又 要 
求 某 种 类 型 时 ，Rust 会 使 用 这 种 基 元 类 型 。 
例如 ， 没 有 返回 值 的 函数 的 返回 类 型 就 是 ()。 标 准 库 的 std: :mem: :swap 函数 没有 什么 值得 
返回 的 值 ， 它 只 古 把 两 个 参数 的 值 交 换 一 下 。std: :mem: :swap 的 声明 如 下 : 

fn swap<T>(x: &mut T, y: &mut T); 
这 个 <T> 表示 swap 是 泛 型 函数 ， 即 任何 类 型 T 值 的 引用 都 可 以 用 它 。 但 这 个 方法 签名 完全 
省 略 了 swap 的 返回 类 型 ， 其 实 它 是 对 以 下 这 个 返回 基 元 类 型 版 本 的 简写 : 


fn swap<T>(x: &mut T, y: &mut T) -> (); 




































































类 似 地 ， 前 面 提 到 的 write_image 返回 Result<()，std::io::Error> 类 型 ,意思 是 这 个 函 
数 会 在 出 错时 返回 std: :io::Error， 成 功 时 则 不 返回 值 。 


如 果 你 喜欢 ， 也 可 以 在 元 组 的 最 后 一 个 元 素 后 面 加 个 有 逗号， 比如 (&str，i32) 和 (&str，i32,) 
是 相同 的 类 型 ， 而 表达 式 ("Brazil"，1985) 和 ("Brazil"，1985,) 也 相等 。 不 仅 如 此 ， 
Rust 允许 在 函数 参数 、 数 组 、 结 构 体 、 枚 举 等 任何 使 用 逗号 的 地 方 的 末尾 再 加 一 个 逗号 。 
这 在 人 类 看 来 可 能 有 点 怪 ， 但 在 列表 末尾 发 生 了 元 素 的 增删 操作 之 后 ， 差 异 会 比较 容易 看 
出 来 。 

出 于 一 致 性 的 考虑 ， 甚 至 可 以 有 包含 一 个 单一 值 的 元 组 。 字 面 量 ("LoneLy hearts",) 就 是 
只 包含 一 个 单一 字符 串 的 元 组 ， 其 类 型 为 (&str,)。 这 时 候 ， 末 尾 的 过 号 就 是 必需 的 了 ， 
没有 它 则 无 法 区 分 这 是 个 元 组 还 是 简单 的 括号 表达 式 。 


3.3 ”指针 类 型 
Rust 有 几 种 表示 内 存 地 址 的 类 型 。 


这 是 Rust 在 垃圾 收集 方面 与 大 多 数 语言 不 一 样 的 地 方 。 在 Java 中 ， 如 果 class Tree 包含 
一 个 字段 Tree Left;， 那 么 Left 就 是 一 个 指向 在 其 他 地 方 创建 的 另 一 个 Tree 对 象 的 引用 。 
Java 中 的 对 象 从 来 不 会 在 物理 上 包含 另 一 个 对 象 。Rust 不 同 ， 其 设计 目标 就 是 保持 内 存 占 
用 最 小 化 ， 因 此 Rust 中 的 值 默 认 是 租 套 的 ， 比 如 ((6，9)，(1449，990)) 会 被 保存 为 4 个 
相 邻 的 整数 。 如 果 把 它 保存 在 一 个 局 部 变量 中 ， 那 它 就 变 成 了 一 个 4 个 整数 宽 的 局 部 变 
量 。 此 时 不 会 占用 堆 内 存 。 
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这 对 提升 内 存 使 用 效率 非常 重要 ， 但 同时 也 带 来 了 一 个 后 果 : 当 Rust 程序 中 的 值 需要 指向 
其 他 值 时 ， 就 必须 显 式 地 使 用 指针 类 型 。 不 过 不 用 担心 ， 在 安全 Rust 程序 中 使 用 指针 会 受 
到 限制 以 消除 未 定义 行为 ， 因 而 指针 在 Rust 中 比 在 C++ 中 更 容易 正确 使 用 。 


本 市 将 讨论 3 种 指针 类 型 : 引用 、Box 和 不 安全 指针 。 


3.3.1 引用 
一 个 &String ( 读 作 “引用 字符 串 ”) 类 型 的 值 就 是 一 个 对 String 值 的 引用 ， 而 一 个 &i32 
就 是 一 个 对 132 值 的 引用 ， 以 此 类 推 。 
理解 引用 最 简单 的 办 法 就 是 把 它 想象 成 Rust 的 基本 指针 类 型 。 引 用 可 以 指向 任何 地 方 的 
任何 值 ， 无 论 栈 上 还 是 堆 上 。 表 达 式 &x 会 产生 一 个 对 x 的 引用 ， 用 Rust 的 话说 ， 就 是 它 
借用 了 一 个 对 x 的 引用 。 而 拿 到 一 个 引用 r， 表 达 式 *r 引用 的 则 是 r 指向 的 值 。 这 跟 C 和 
C++ 中 的 & 和 * 非 常 相似 。 而 且 就 像 C 指针 一 样 ， 引 用 在 超出 作用 域 之 后 不 会 自动 释放 任 
何 资源 。 
但 与 C 指针 不 同 的 是 ，Rust 引用 永远 不 会 是 空 值 ， 因 为 在 安全 Rust 代码 中 根本 不 可 能 7 
生 空 引用 。 而 且 Rust 引用 默认 是 不 可 修改 的 。 
口 &T 
不 可 修改 引用 ， 类 似 C 中 的 const T*。 
DD &mut T 

可 修改 引用 ， 类 似 C 中 的 T*。 


另 一 个 主要 的 区 别 是 Rust 会 跟踪 值 的 所 有 权 和 生成 期 ， 因 此 悬空 指针 、 重 复 释 放 和 指针 失 
效 之 类 的 错误 全 部 会 在 编译 时 被 发 现 。 第 5 章 将 解释 Rust 安全 引用 使 用 规则 。 



































3.3.2 Box 
在 堆 上 分 配 一 个 值 的 最 简单 方式 就 是 使 用 Box: :new: 

Let t = (12, "eggs"); 

Let b = Box: :new(t); // 在 堆 中 分 配 一 个 元 组 
t 的 类 型 是 (i132，&str)， 因 此 b 的 类 型 是 Box<(i32，&str)>。Box: :new() 会 为 这 个 元 组 在 
堆 上 分 配 足 够 大 的 内 存 。 而 当 b 超出 作用 域 之 后 ， 内 存 会 自动 释放 ， 除 非 b 被 转移 了 ( 比 
如 被 返回 )。 


转移 是 Rust 处 理 分 配 到 堆 上 的 值 的 根本 方式 ， 第 4 章 将 详细 解释 。 


3.3.3 原始 指针 


Rust 也 有 原始 指针 类 型 *mut T 和 *const T。 原 始 指针 实际 上 就 是 C++ 中 的 那 种 指针 。 使 
用 原始 指针 是 不 安全 的 ， 因 为 Rust 不 会 跟踪 它 指向 哪里 。 为 此 ， 原 始 指 针 可 能 为 空 ， 也 可 
能 指向 已 经 被 释放 的 内 存 ， 或 者 指向 一 个 现在 已 经 保存 了 不 同类 型 值 的 内 存 。C++ 中 所 有 
经 典 的 指针 错误 应 有 尽 有 ， 敬 请 好 自 为 之 。 


















































不 过 ， 对 于 原始 指针 解 引 用 一 般 只 能 在 unsafe 块 中 进行 。unsafe 块 是 Rust 提供 的 可 选 机 
制 ， 专 为 安全 责任 自负 的 程序 员 使 用 高 级 语言 特性 提供 。 如 有 果 你 的 代码 里 没 用 unsafe 块 
(或 者 有 但 写 的 不 正确 )， 那 么 本 书 反复 强调 的 安全 保障 则 始终 有 效 。 关 于 不 安全 的 代码 ， 
第 21 章 将 详细 讨论 。 


3.4 数组 、 回 量 和 切片 
Rust 有 3 种 在 内 存 中 表示 一 系列 值 的 类 型。 


。 类 型 [T; N] 表示 一 个 N 个 值 的 数组 ， 每 个 值 的 类 型 都 是 T。 数 组 的 大 小 是 在 编译 时 确定 
的 常量 ,也 是 类 型 自身 的 一 部 分 。 换 名 话说 ,不 能 向 数组 中 追加 新 元 素 , 也 不 能 缩短 数组 。 

。 类 型 vec<T> 叫 作 T 类 型 的 向 量 ， 是 一 种 动态 分 配 、 可 扩展 的 类 型 的 值 序列 。 向 量 的 
元 素 保存 在 堆 上 ， 因 此 可 以 随意 缩放 它 : 向 其 中 推 人 新 元 素 、 追 加 其 他 向 量 ， 或 者 删除 
元 素 ， 等 等 。 

。 类 型 &[T] 和 &mut [T] 叫 作 T 类 型 的 共享 切片 和 T 类 型 的 可 修改 切片 ， 是 对 其 他 值 〈 比 
如 数组 或 向 量 ) 中 部 分 元 素 序列 的 引用 。 可 以 把 切片 想象 成 一 个 指针 ， 包 含 切 片 中 第 一 
个 元 素 的 地 址 和 从 这 个 元 素 起 可 以 访问 元 素 的 数量 ,可 修改 切片 &mut [T] 允许 读 写 元 素 ， 
但 不 能 共享 ， 而 共享 切片 &[T] 可 以 由 多 个 读者 读 取 ， 但 不 允许 修改 元 素 。 


对 于 这 3 种 类 型 的 值 v， 表 达 式 v.len() 返回 v 中 的 元 素数 量 ， 而 v[i] 引用 的 是 v 的 第 1 
个 元 素 。 第 一 个 元 素 是 v[9] ， 最 后 一 个 元 素 是 v[v.Len() - 1]。Rust 会 检查 1 始终 位 于 有 
效 范围 内 ， 否 则 ， 表 达 式 会 导致 售 异 。v 的 长 度 可 能 是 零 ， 此 时 尝试 用 任何 索引 访问 其 元 
素 都 会 导致 惊异 。i 必须 是 一 个 usize 值 ， 其 他 任何 整数 类 型 都 不 能 用 作 索 引 。 


3.4.1 数组 
数组 的 值 有 几 种 写法 。 最 简单 的 写法 是 把 一 系列 逗 吕 分 隔 的 值 用 方 括号 括 起 来 : 


Let Lazy_caterer: [u32; 6] = [1, 2, 4, 7, 11, 16]; 
let taxonomy = ["Animalia", "Arthropoda", "Insecta"]; 




































































assert eq!(lazy_caterer[3], 7); 
assert_eq!(taxonomy.len(), 3); 


对 于 常见 的 给 一 个 长 数组 填充 值 的 情况 ， 可 以 写作 [V; N]: Vv 是 每 个 元 素 的 值 ，N 是 长 度 。 
比如 ，[true; 10000] 就 是 一 个 包含 10 000 个 bool 元 素 的 数组 ， 所 有 元 素 都 是 true: 


let mut sieve = [true; 10000]; 
for i in 2..100 { 
if sieve[i] { 
Let mut j = i * i; 
while j < 10000 { 
sieve[j] = false; 
j += i; 
} 
} 
} 
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assert!(sieve[211]); 
assert!(!sieve[9876]); 


还 有 一 种 写法 ， 即 [0u8; 1624] ， 用 于 表示 固定 大 小 的 缓冲 区 (这 里 是 1 KB 的 缓冲 区 ， 以 
零 字 节 填 充 )。Rust 没有 语法 表示 未 初始 化 的 数组 。( 通 常 ，Rust 会 保证 代码 永远 不 访问 任 
何 未 经 初始 化 的 值 。) 


数组 的 长 度 是 其 类 型 的 一 部 分 ， 在 编译 时 就 确定 了 。 如 果 n 是 一 个 变量 ， 那 么 通过 
[true; n] 不 会 得 到 一 个 n 元 素 的 数组 。 如 果 你 在 运行 时 需要 一 个 数组 的 长 度 可 变 (很 
见 )， 那 就 用 向 量 。 


我 们 看 到 的 用 于 数组 的 方法 ， 比 如 迭代 元 素 、 搜 索 、 排 序 、 填 充 、 筛 选 等 ， 都 是 切片 的 方 
法 ， 并 非 数 组 的 方法 。 不 过 ，Rust 会 在 查找 方法 时 隐 式 地 把 对 数组 的 引用 转换 为 对 切片 的 
引用 ， 因 此 可 以 直接 在 数组 上 调用 切片 的 任何 方法 : 

Let mut chaos = [3，5，4，1，2]; 


chaos.sort(); 
assert eq!(chaos, [1, 2, 3, 4, 5]); 


这 里 的 sort 方法 实际 上 是 在 切片 上 定义 的 ， 但 因为 sort 是 通过 引用 取得 其 操作 数 的 ， 
所 以 可 以 直接 在 chaos 上 使 用 它 。 这 个 调用 会 隐 式 地 产生 一 个 将 整个 数组 作为 切片 的 引 
用 &mut [i32]。 事 实 上 ， 前 面 提 到 的 Len 方法 也 是 一 个 切片 方法 。3.4.4 市 会 更 详细 地 讨论 
切片。 
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3.4.2 癌 量 

向 量 Vec<T> 是 分 配 在 堆 上 的 类 型 的 可 缩放 序列 。 

创建 向 量 的 方式 有 好 几 种 。 最 简单 的 方式 是 使 用 vec! 宏 ， 这 种 语法 看 起 来 非常 像 创建 数组 
字面 量 ， 


Let mut v = vec![2，3，5，7]; 
assert_eq!(v.iter().foLd(1，|a，b| a * b), 210); 


当然 ， 这 是 一 个 向 量 ， 不 是 数组 ， 因 此 可 以 动态 地 向 其 中 添加 元 素 : 


v.push(11); 
v.push(13); 
assert eq!(v.iter().fold(1, |a, b| a * b), 30030); 


还 可 以 通过 模仿 数组 字面 量 的 语法 将 一 个 值 重复 一 定 次 数 来 构建 向 量 : 


fn new_pixel_buffer(rows: usize, cols: usize) -> Vec<u8> { 
vec![0; rows * cols] 


} 
调用 vec! 宏 等 价 于 调用 Vec: :new 创建 一 个 新 的 空 问 量 ， 然 后 再 向 其 中 推 和 元素， 这 也 是 
一 种 写法 : 

let mut v = Vec::new(); 


v.push("step"); 
v.push("on"); 






































v.push("no"); 
v.push("pets"); 
assert_ eq!(v, vec!["step", "on", "no", "pets"]); 


另 一 种 方式 是 基于 迭代 器 产生 的 值 来 构建 向 量 ; 


let v: Vec<i32> = (0..5).collect(); 
assert_eq!(v, [0, 1, 2, 3, 4]); 


在 使 用 collect 时 通常 要 写 明 类 型 (就 像 这 里 一 样 )， 因 为 这 个 方法 可 以 构建 多 种 集合 ， 不 
仅 是 向 量 。 明 确 了 v 的 类 型 ， 就 明确 了 我 们 想 要 构建 的 集合 类 型 。 


与 数组 类 似 ， 对 向 量 也 可 以 使 用 切片 方法 : 
// 回 文 ! 


Let mut v = vec!["a man"，"a plan", "a canal", "panama"]; 

v.reverse(); 

// 合理 但 令 人 扫兴 

assert eq!(v, vec!["panama", "a canal", "a plan", "a man"]); 
这 里 的 reverse 方法 实际 是 在 切片 上 定义 的 ， 只 不 过 这 个 调用 隐 式 地 从 向 量 借用 了 &mut 
[&str]， 并 在 这 个 切片 引用 上 调用 了 reverse。 


Vec 是 Rust 的 一 个 基本 类 型 ， 几 乎 任何 需要 动态 列表 的 地 方 都 会 用 到 它 ， 因 此 还 有 很 多 其 
他 方法 可 以 构建 新 向 量 或 扩展 已 有 向 量 。 相 关内 容 第 16 章 将 介绍 。 


一 个 Vec<T> 包含 3 个 值 : 对 分 配 在 堆 上 用 于 保存 元 素 的 缓冲 区 的 引用 、 该 缓冲 区 可 以 存储 
的 元 素 个 数 (也 就 是 容量 )， 以 及 当前 实际 存储 的 元 素 个 数 (也 就 是 长 度 )。 当 缓冲 区 达到 
其 容量 上 限 后 ， 再 给 向 量 添加 元 素 会 导致 一 系列 操作 : 分 配 一 个 更 大 的 缓冲 区 ， 将 现 有 内 
容 复制 过 去 ， 基 于 新 缓冲 区 更 新 向 量 的 指针 和 容量 ， 最 后 释放 旧 缓 冲 区 。 


如 果 提 前 知道 向 量 中 需要 保存 的 元 素 个 数 ， 可 以 使 用 Vec: :with_capacity (而 不 是 Vec: :new) 
eR A en i A ed ps 
免 内 存 的 重新 分 配 。vec! 宏 使 用 了 与 此 类 似 的 一 个 技巧 ， 因 为 它 知 道 向 量 最 终 会 拥有 多 少 
元 素 。 1 4 是 配置 了 向 量 的 初始 大 小 ， 如 果 超 出 了 预 估 ， 那 么 癌 量 还 是 会 像 往 常 
一 样 增 大 。 


很 多 库 国 数 会 尽量 使 用 vec: :with_capacity， 避 免 使 用 vec::new。 上 比如， 在 上 面 coLLect 
的 例子 中 ， ee a 而 collect 函数 会 利用 它 为 自己 返回 
的 向 量 预 分 配 正确 的 容量 。 第 15 章 将 深入 讨论 这 个 过 程 。 
就 像 向 量 的 Len 方法 返回 它 包 含 的 元 素 个 数 一 样 ， 它 的 capacity 方法 返回 无 须 重新 分 配 即 
可 包含 的 元 素 个 数 : 

Let mut v = Vec::with capacity(2); 


assert_eq!(v.len(), 0); 
assert_eq!(v.capacity(), 2); 
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v.push(1); 

v.push(2); 

assert eq!(v.len(), 2); 
assert_ eq!(v.capacity(), 2); 





及 
讨 
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v.push(3); 
assert_ eq!(v.len(), 3); 
assert eq!(v.capacity(), 4); 





你 在 自己 代码 里 看 到 的 容量 可 能 会 跟 这 里 有 出 入 。vVec 和 系统 的 堆 分 配 程序 可 能 会 向 上 舍 
入 ， 即 使 在 使 用 with_capacity 的 情况 下 也 是 如 此 。 


可 以 在 向 量 的 任何 位 置 随意 插入 或 删除 元 素 。 不 过 ， 由 于 这 些 操作 会 导致 插入 点 之 后 的 元 
素 全 部 前 移 或 后 移 ， 因 此 对 于 长 向 量 而 言 可 能 会 比较 慢 。 








Let mut v = vec![10, 20, 30, 40, 50]; 





// 在 索引 3 处 插入 35 
v.insert(3, 35); 
assert eq!(v, [10, 20, 30, 35, 40, 50]); 





// 删除 索引 1 处 的 元 素 
v.remove(1); 
assert eq!(v, [10, 30, 35, 40, 50]); 


使 用 pop 方法 可 以 删除 并 返回 最 后 一 个 元 素 。 更 准确 地 说 ， 是 从 Vec<T> 中 删除 一 个 值 ， 返 




















回 一 个 0ption<T>: 如 果 向 量 是 空 的 则 返回 None， 如 果 最 后 一 个 元 素 是 v 则 返回 Some(v): 





Let mut v = vec!["carmen", "miranda"]; 
assert_eq!(v.pop(), Some("miranda")); 
assert_ eq!(v.pop(), Some("carmen")); 
assert_eq!(v.pop(), None); 


使 用 for 循环 可 以 迭代 遍历 向 量 ; 


运行 


// 取得 命令 行 参数 并 转换 为 字符 串 向 量 
Let Languages: Vec<String> = std::env::args().skip(1).collect(); 
for L in languages { 
println!("{}: {€}", l, 
if l.len() % 2 ==0f 
"functional" 
} elsef{ 
"imperative" 


}); 


个 程序 并 传 入 儿 个 编程 语言 的 名 称 ， 你 会 受到 启发 : 


$ cargo run Lisp Scheme C C++ Fortran 
Compiling fragments vO.1.0 (file:///home/jimb/rust/book/fragments) 
Running “.../target/debug/fragments Lisp Scheme C C++ Fortran. 
Lisp: functional 
Scheme: functional 
C: imperative 
C++: imperative 
Fortran: imperative 


$ 


最 终 ， 我 们 看 到 了 对 函数 式 语言 的 满意 定义 。 





尽管 扮演 了 最 基本 的 角色 ，Vec 仍然 是 Rust 定义 的 一 个 普通 类 型 ， 没 有 内 置 在 语言 中 。 第 
21 章 将 介绍 实现 这 种 类 型 的 技术 。 


3.4.3 ”逐个 元 素 地 构建 向 量 

以 每 次 添加 一 个 元 素 的 方式 构建 向 量 并 没有 了 听 起 来 那么 差劲 。 每 当 向 量 增长 到 超过 其 缓冲 
区 容量 时 ， 它 都 会 选择 一 个 比 原来 大 一 倍 的 新 缓 站 区。 假设 有 一 个 向 量 ， 其 缓冲 区 开始 只 
有 一 个 元 素 ， 随 着 元 素 增加 ， 其 容量 也 会 1、2、4、8 这 样 增 大 ， 直 至 最 终 增 大 到 2"。 想 
一 想 2 的 乘 方 的 原理 ， 会 发 现 所 有 之 前 较 小 的 缓冲 区 之 和 等 于 2 1， 与 最 终 的 缓冲 区 大 小 
非常 接近 。 因 为 实际 元 素 的 个 数 至 少 是 缓冲 区 大 小 的 一 半 ， 所 以 向 量 中 的 元 素 自 始 至 终 都 
不 会 有 两 个 副本 。 
这 意味 着 ， 使 用 Vec: :with_capacity 而 不 是 Vec: :new 可 以 从 速度 而 非 算法 上 获得 持续 改 
进 。 对 于 较 小 的 向 量 ， 少 调用 几 次 堆 分 配器 性 能 差异 还 是 很 明显 的 。 


3.4.4 切片 

切片 (slice)， 写 作 不 指定 长 度 的 [IT] ， 表 示 数 组 或 向 量 的 一 个 范围 。 由 于 切片 可 以 是 任意 
度 ， 因 此 不 能 直接 保存 到 变量 中 ， 也 不 能 作为 函数 参数 传递 。 切 片 永远 只 能 按 引 用 传递 。 
切片 的 引用 是 一 个 胖 指 针 (fat pointer) ， 即 一 个 双 字 宽 的 值 ， 保 存 着 指向 切片 第 一 个 元 素 
的 指针 和 切片 中 元 素 的 个 数 。 


















































假设 运行 如 下 代码 : 
Let v: Vec<f64> = vec![0.0, 0.707, 1.0, 0.707] 
let a: [f64; 4] = [0.0, -0.707, -1.0, -0.707]; 


let sv: &[f64] = &v; 
Let sa: &[f64] = &a; 


运行 最 后 两 行 时 ，Rust 会 自动 把 引用 &Vec<f64> 和 &[f64; 4] 转换 为 直接 指向 数据 的 切片 
引用 。 


最 终 ， 内 存 看 起 来 如 图 3-2 所 示 。 
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图 3-2: 内 存 中 的 向 量 v 和 数组 a， 以 及 引用 它们 的 切片 sv 和 sa 
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普通 引用 是 对 单个 值 的 非 所 有 型 指针 ， 切 片 引 用 则 是 对 多 个 值 的 非 所 有 型 指针 。 因 此 切片 
引用 非常 适合 操作 一 串 同 类 数据 的 函数 ， 无 论 这 串 数据 存储 在 数组 、 向 量 ， 抑 或 栈 还 是 堆 
上 。 比 如 ， 下 面 这 个 了 国 数 打印 了 一 个 数值 切片 ， 每 行 打印 了 一 个 数值 : 

fn print(n: &[f64]) { 


for elt in n { 
println!("{}", elt); 








} 
} 


print(&v); // 操作 向 量 
print(&a); // 操作 数组 


因为 这 个 函数 以 一 个 切片 3| 用 作为 参数 ， 所 以 可 以 像 上 面 代码 所 示 的 那样 给 它 传 入 癌 量 或 
数组 的 引用 。 事 实 上 ， 很 多 我 们 以 为 是 向 量 或 数组 的 方法 是 定义 在 切片 上 的 。 比 如 ， 就 地 
排序 和 反 转 一 系列 元 素 的 sort 和 reverse 方法 实际 上 是 切片 类 型 [T] 的 方法 。 
在 索引 中 使 用 范围 可 以 获取 对 数组 或 向 量 切 片 的 引用 ， 或 者 对 现 有 切片 的 切片 的 引用 : 
print(&v[0..2]); // 打印 v 的 前 两 个 元 素 
print(&a[2..]); // 从 a[2] 开 始 打印 a 的 元 素 
print(&sv[1..3]); // 打印 v[1] 和 v[2] 
与 访问 普通 数组 类 似 ，Rust 也 会 检查 此 时 的 索引 是 否 有 效 。 试 图 借用 超出 数据 长 度 范围 的 
切片 会 导致 惊异 。 
我 们 经 常 把 &[T] 或 &str 这 样 的 引用 类 型 称 为 切片 ， 其 实 是 有 点 偷懒 了 。 实 际 上 ， 应 该 称 
它们 为 对 切片 的 引用 。 不 过 因为 提 到 切片 基本 上 都 是 指 对 它 的 引用 ， 所 以 也 就 用 “切片 ” 
来 指 代 “切片 引用 ”了 。 


Ar CD > 
3.5 ”字符 串 类 型 
熟悉 C++ 的 程序 员 会 记得 该 语言 中 有 两 种 字符 串 类 型 。 字 符 串 字面 量 拥有 指针 类 型 const 
char *。 标 准 库 也 定义 了 一 个 类 ， 即 std: :string， 用 于 在 运行 时 动态 创建 字符 串 。 


Rust 也 采用 了 类 似 的 设计 。 本 节 将 展示 字符 串 字 面 量 的 各 种 写法 ， 然 后 再 介绍 Rust 的 两 
种 字符 串 类 型 。 关 于 字符 串 和 文本 处 理 的 更 多 内 容 ， 参 见 第 17 章 。 


3.5.1 字符 串 字 面 量 

字符 串 字面 量 放 在 一 对 双 引 号 中 。 需 要 使 用 反 斜 杠 转 义 的 情形 跟 char 字面 量 相同 : 
Let speech = "\"Ouch!\" said the well.\n"; 

与 char 字面 量 不 同 的 是 ， 在 字符 串 字面 量 中 ， 单 引号 无 须 转 义 ， 双 引号 需要 转 义 。 

字符 串 可 以 分 散 到 多 行 : 


println!("In the room the women come and go， 
Singing of Mount Abora"); 
















































































这 个 字符 串 字 面 量 中 的 换行 符 和 第 二 行 开 头 的 空白 符 都 包含 在 字符 串 中 ， 因 此 也 会 输出 。 
如 果 多 行 字符 串 中 的 一 行 以 反 斜 杠 结尾 ， 那 么 该 行 的 换行 符 和 下 一 行 开头 的 空白 符 会 被 删除 : 


println!("It was a bright, cold day in April, and \ 
there were four of us—\ 
more or less."); 


这 行 代码 会 打印 一 行文 本 。 字 符 串 的 “and” 和 “there” 之 间 只 有 一 个 空格 ， 因 为 代码 中 
的 反 斜 杠 前 面 有 一 个 空格 ， 而 连 字符 后 面 没 有 空格 。 

有 时 候 ， 把 所 有 反 斜 杠 都 打 两 遍 也 很 烦人 (经 典 的 例子 就 是 正则 表达 式 和 Windows 路 径 )。 
针对 这 种 情况 ，Rust 提供 了 原始 字符 串 (raw string) 语法 。 原 始 字符 串 以 小 写字 母 r 为 标 
记 ， 其 中 的 所 有 有 反 斜 杠 和 空白 符 都 会 原样 包含 在 字符 串 中 ， 转 义 序列 无 效 。 


Let default win install path = r"C:\Program Files\Gorillas"; 



























































Let pattern = Regex: :new(r"\d+(\.\d+)*"); 
要 在 原始 字符 串 中 包含 双 引 号 ， 简 单 地 在 双 引 号 前 面 加 个 反 斜 本 是 不 行 的 。 前 面 刚 说 过 ， 
原始 字符 串 中 的 转 义 序列 无 效 。 不 过 也 有 办 法 ， 即 在 原始 字符 串 的 开头 和 末尾 添加 井 字号 
标记 : 


println!(r###" 
This raw string started with 'r###"'. 
Therefore it does not end until we reach a quote mark ('"') 
followed immediately by three pound signs ('###'): 

"###) ; 


开头 和 末尾 加 多 少 个 井 字 号 都 可 以 ， 只 要 能 让 Rust 确定 原始 字符 串 在 哪儿 结尾 就 行 。 


3.5.2” 字 节 字 符 串 


字 节 字符 串 (byte string) 就 是 带 有 前 级 b 的 字符 串 字面 量 。 字 节 字 符 串 是 u8 值 〈 即 字 节 ) 
的 切片 ， 不 是 Unicode 文本 的 切片 : 


let method = b"GET"; 
assert_eq!(method，&[b'G'，b'E'，b'T']); 


字符 串 可 以 使 用 我 们 刚刚 看 到 的 所 有 字符 串 语 法 : 可 以 跨 多 行 、 使 用 转 义 序列 、 使 用 
和 斜 杠 连接 行 。 原 始 字 节 字符 串 以 br" 开头 。 

字符 串 不 能 包含 任意 Unicode 字符 ， 只 能 是 ASCI 和 \xHH 转 义 序列 。 

method 的 类 型 是 &[u8; 3]， 即 对 包含 3 个 字 节 的 数组 的 引用 。 它 没有 后 面 将 要 介绍 的 
字符 串 方 法 。 最 像 字符 串 的 地 方 就 是 它 的 语法 。 

3.5.3 ”字符 串 在 内 存 中 的 表示 


Rust 字符 串 就 是 Unicode 字符 序列 ， 但 它 在 内 存 中 不 是 以 char 数组 的 形式 存储 的 。 事 实 
上 ,字符 串 在 内 存 中 使 用 UTF-8 可 变 宽度 编码 存储 。 字 符 串 中 的 每 个 ASCII 字符 用 1 个 字 
































世 河 必 
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同村 





en 











基本 类 
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Un 
Wu 








节 存 储 ， 其 他 字符 则 占用 多 个 字 贡 。 
图 3-3 展示 了 以 下 代码 创建 的 String 和 &str 值 。 


Let noodles = "noodles".to_string(); 
Let oodles = &noodles[1..]; 
let poodles = "5 5"; 











noodles: 00dles: poodles: 
String &str &str 
一 -人 一 一 -人 一 





“5” 的 UTF-8 编 码 
占用 3 个 字 节 
/一 一 人 -一 一 

















str 
(无 固定 大 小 ) 


























3-3: String、&str 和 str 


























string 有 一 个 可 伸缩 缓冲 区 用 于 存储 UTF-8 文本 。 这 个 缓冲 区 分 配 在 堆 上 ， 因 此 可 以 按 需 
要 或 请 求 来 调整 大 小 。 在 这 个 例子 中 ，noodets 是 一 个 拥有 8 字 节 缓冲 区 的 String， 它 占 
用 了 其 中 7 字 节 。 可 以 把 String 想象 成 一 个 能 够 存储 格式 完好 的 UTF-8 的 vec<u8>。 事 实 
上 ，String 也 确实 是 这 么 实现 的 。 

&str (发 音 “stir” 或 叫 “字符 串 切 片 ") 是 对 其 他 变量 拥有 的 一 串 UTF-8 文本 的 引用 : 它 
“借用 ”了 这 些 文本 。 在 这 个 例子 中 ，oodles 是 一 个 对 noodles 拥有 的 文本 后 6 个 字 市 的 
&str 引用 ， 因 此 它 表 示 的 是 文本 “oodles”。 与 其 他 切片 引用 类 似 ，&str 也 是 一 个 胖 指 针 ， 
包含 实际 数据 的 地 址 及 其 长 度 。 可 以 把 &str 想象 成 就 是 一 个 &[u8] ， 只 不 过 它 能 存储 格式 
完好 的 UTF-8。 


字符 串 字面 量 就 是 一 个 引用 预 分 配 文 本 的 &str， 通 常 跟 程序 的 机 器 码 一 起 存储 在 只 读 内 
存 中 。 在 前 面 的 例子 中 ，poodtes 是 一 个 字符 串 字 面 量 ， 指 向 程序 执行 时 创建 的 7 个 字 节 ， 
这 7 个 字 市 在 程序 退出 时 会 被 释放 。 
String 或 &str 的 .len() 方 法 返回 它们 的 长 度 。 长 度 以 字 市 而 非 字 符 度量 : 


assert_eq!("d 5".len(), 7); 
assert_eq!("d 5".chars().count(), 3); 
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不 要 试图 修改 &str， 因 为 它 是 无 法 修改 的 : 


Let mut s = "hello"; 
s[0] = 'c'; // error: the type "str ”cannot be mutably indexed 
s.push('\n'); // error: no method named “push ”found for type ‘&str. 


如 果 想 在 运行 时 创建 新 字符 串 ， 那 么 要 使 用 String。 


确实 存在 &mut str 类 型 ,但 用 处 不 大 ， 因 为 几乎 对 UTF-8 的 任何 操作 都 会 改变 其 总 字 寺 
长 度 ， 而 切片 又 不 可 能 重新 分 配 它 引 用 的 缓冲 区 。 事 实 上 ，&mut str 上 仅 有 两 个 方法 ， 





























加 二 








make_ascii_uppercase 和 make_ascii_lowercase， 根 据 定义 它们 只 就 地 修改 文本 且 只 影响 
单字 地 字符 。 


3.5.4 ”字符 串 
&str 类 似 8[T]， 就 是 一 个 指向 某 些 数 据 的 胖 指 针 。String 则 类 似 vec<T>， 如 表 3-10 所 示 。 
表 3-10: Vec<T> 与 String 对 比 


























Vec<T> String 
自动 释放 内 存 是 是 
可 扩展 是 是 
::new() 和 : :with_capacity() 静态 方法 是 是 
.reverse() 和 .capacity() 方法 是 是 
.push() 和 .pop() 方法 是 是 
范围 语法 v[start. .stop] 是 ， 返 回 &[T] 是 ， 返 回 &str 
自动 转换 &vec<T> 到 &[T] &String 到 &str 
继承 方法 继承 自 &[T] 继承 自 &str 





类 似 vec， 每 个 String 也 有 自己 分 配 在 堆 上 的 缓冲 区 ， 不 跟 任 何其 他 String 共享 。 当 
String 变量 超出 作用 域 后 ， 甚 缓冲 区 会 自动 释放 ， 除 非 String 的 所 有 权 已 被 转移 。 
以 下 几 种 方式 可 以 创建 String。 
。 .to_string() 方法 可 以 把 &str 转换 为 String。 实 际 上 是 复制 字符 串 。 
let error_message = "too many pets".to_string(); 
。 format!() 宏 跟 printtn!() 类 似 ， 区 别 在 于 它 返 回 一 个 新 String 而 不 是 将 文本 写 入 标 
准 输出 ， 并 且 不 会 自动 在 末尾 加 换行 符 。 
assert_eq!(format!("{}°{:02} '{:02}"N", 24, 5, 23), 
"24°05 '23"N" .to_string()); 
。 字符 串 的 数组 、 切 片 和 向 量 有 两 个 方法 : .concat() 和 .join(sep)， 可 以 将 多 个 字符 串 
拼接 成 一 个 新 String。 


let bits = vec!["veni", "vidi", "vici"]; 























assert_ eq!(bits.join(", "), "veni, vidi, vici"); 
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有 了 时候， 到 底 应 该 使 用 &str 还 是 String 总 会 让 人 困惑 。 第 5 章 将 详细 讨论 这 个 问题 。 目 
前 ， 只 要 知道 &str 可 以 引用 任何 字符 串 的 任意 切片 即 可 ， 无 论 它 是 (存储 在 可 执行 文件 中 
的 ) 字符 串 字 面 量 ， 还 是 (运行 时 分 配 和 释放 的 ) String。 这 意味 着 当 调 用 者 可 以 使 用 任 
意 一 种 字符 串 时 ，&str 更 适合 作为 函数 参数 。 


3.5.5 ”使 用 字符 串 


字符 串 支 持 == 和 != 操作 符 。 如 果 两 个 字符 串 包 含 的 字符 相同 、 顺 序 也 相同 ， 那 它们 就 是 
相等 的 ， 无 论 它 们 是 否 指向 内 存 中 的 同一 个 地 址 。 


assert!("ONE" .to_Lowercase() == "one"); 


字符 串 也 支持 比较 操作 符 <、<=、> 和 >=， 以 及 很 多 有 用 的 方法 和 国 数 。 通 过 在 在 线 文档 
中 搜索 “str (primitive type)” 或 “std::str” 模 块 可 以 查看 (或 者 直接 翻 到 第 17 章 也 可 
以 )。 以 下 是 几 个 例子 : 

assert!("peanut".contains("nut")); 


assert_eq!("5 5".replace("g", "mE"), "mn"); 
assert eq!(" clean\n" .trim(), "clean"); 











for word in "veni, vidi, vici".split(", ") { 
assert!(word.starts_with("v")); 


} 


但 要 记 住 ，Unicode 的 特性 决定 了 简单 的 逐个 字符 比较 不 一 定 得 到 想 要 的 结果 。 比 如 ， 
Rust 字符 串 "th\ufe9}" 和 "the\u{391}" 都 是 thé (法 语 “ 茶 ”) 的 有 效 Unicode 表现 形式 。 
对 这 两 个 字符 串 ，Unicode 认为 无 论 显 示 和 处 理 都 应 该 一 视 同仁 ， 但 Rust 认为 它们 是 两 个 
完全 不 同 的 字符 串 。 类 似 地 ， 像 < 这 样 的 比较 操作 符 只 会 简单 地 基于 字符 码 点 值 的 词典 顺 
序 进 行 比较 。 这 个 顺序 只 是 有 时 候 会 跟 特 定 用 户 语 言 和 文化 下 的 文本 顺序 一 致 。 这 些 问 题 
第 17 章 将 详细 讨论 。 


3.5.6 ”其 他 类 似 字符 串 的 类 型 
Rust 保证 字符 串 是 有 效 的 UTF-8。 有 时 候 ， 程 序 可 能 需要 处 理 不 是 有 效 Unicode 的 字符 
串 。 这 通常 发 生 在 Rust 程序 必须 与 其 他 系统 互 操作 ， 而 其 他 系统 又 没有 采取 相同 强制 措施 
的 情况 下 。 比 如 ， 在 大 多 数 操作 系统 中 ， 可 以 轻易 创建 一 个 文件 ， 但 其 文件 名 不 是 有 效 的 
Unicode。 那 么 当 Rust 程序 磁 到 这 种 文件 名 时 怎么 办 ? 
Rust 的 解决 方案 是 提供 几 个 类 似 字符 串 的 类 型 。 
对 于 Unicode 文本 ,使 用 String 和 &str。 
处 理 文 件 名 时 ， 使 用 std: :path: :PathBuf 和 &Path。 
处 理 根本 不 是 字符 数据 的 二 进 制 数据 时 ， 使 用 Vec<u8> 和 &[u8]。 
处 理 以 操作 系统 原生 形式 表示 的 环境 变量 名 和 命令 行 参数 时 ， 使 用 0sstring 和 &0sStr。 
与 使 用 空 字符 结尾 字符 串 的 C 库 互 操作 时 ， 使 用 std: :ffi::CString 和 &CStr。 






















































































3.6 更 多 类 型 


类 型 是 Rust 的 中 枢 。 本 书后 面 还 会 继续 讨论 类 型 ， 同 时 也 会 介绍 一 些 新 类 型 。 特 别 地 ， 
Rust 的 用 户 定 义 类 型 让 这 门 语言 更 具 特 色 ， 因 为 用 户 定义 类 型 中 会 定义 方法 。 有 3 种 用 户 
定义 类 型 ， 本 书 会 用 连续 3 章 介绍 它们 : 结构 体 (第 9 章 )、 枚 举 (第 10 章 )、 特 型 (第 
11 章 )。 


函数 和 闭 包 都 有 各 自 的 类 型 ， 第 14 章 将 讨论 。 而 标准 库 中 定义 的 类 型 ， 本 书 各 章 都 会 有 
所 涉及 。 比 如 ， 第 16 章 将 介绍 标准 的 集合 类 型 。 

不 过 ， 上 述 这 些 内 容 都 要 等 一 等 。 在 此 之 前 ， 必 须 先 花 点 时 间 弄 清楚 与 Rust 核心 安全 规则 
相关 的 几 个 概念 。 
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第 4 章 


所 有 权 





我 发 现 ，Rust 强迫 我 掌握 了 之 前 C/C++ 中 的 诸多 最 佳 实践 ， 而 且 是 在 编译 代码 
法 前 我 想 强 调 的 是 ，Rust 不 是 那 种 让 你 几 天 就 可 以 上 手 ， 把 困难 /技术 
难题 /最 佳 实践 的 事 都 向 后 推 的 语言 。 它 会 强 连 你 马上 就 进入 严格 安全 的 编程 状 
态 ， 一 开始 可 能 会 有 点 不 适应 。 不 过 ， 根 据 我 的 经 验 ， 这 让 我 再 次 找到 了 我 很 期 
待 的 编译 代码 的 感觉 。 





Mitchell Nordine 

Rust 做 出 了 以 下 两 个 承诺 ， 这 两 个 承诺 同时 确保 这 门 系统 编程 语言 是 安全 的 。 

。 你 来 决定 程序 中 每 个 值 的 生命 期 。Rust 会 在 你 的 控制 下 迅速 释放 与 某 个 值 关 联 的 内 容 和 
其 他 资源 。 
即便 如 些 ， 你 的 程序 也 永远 不 会 在 一 个 对 象 被 释放 后 还 使 用 指向 它 的 指针 。 在 C 和 
C++ 中 , 使 用 悬空 指针 (dangling pointer) 是 常见 错误 : 运气 好 , 程序 会 月 涡 ; 运气 不 好 ， 
程序 就 有 了 一 个 安全 漏洞 。Rust 会 在 编译 时 捕获 这 些 错 误 。 

C 和 C++ 也 遵守 第 一 个 承诺 : 你 随时 可 以 对 动态 分 配 在 堆 内 存 中 的 对 象 调用 free 或 

delete。 但 作为 交换 ， 第 二 个 承诺 则 被 置之不理 : 保证 不 使 用 指向 已 释放 值 的 指针 完全 是 

你 的 责任 。 经 验 表 明 ， 这 个 使 命 很 难 达 成 : 在 各 类 安全 问题 的 数据 报告 中 ， 指 针 误 用 都 是 

一 个 常见 问题 ， 只 要 这 些 数据 已 经 被 收集 到 。 


为 实现 第 二 个 承诺 ， 很 多 语言 使 用 垃圾 收集 在 所 有 指向 某 个 对 象 的 可 访问 指针 都 失效 时 自 
动 释放 该 对 象 。 但 作为 交换 ， 你 必须 把 控制 何 时 释放 对 象 的 权力 让 渡 给 收集 器 。 一 般 来 
说 ， 垃 圾 收集 器 的 脾气 也 不 好 琢磨 ， 有 时 候 本 该 释放 的 内 存 却 没有 释放 ， 而 原因 也 很 难 查 
明 。 如 果 你 使 用 的 对 象 表示 文件 、 网 络 连接 或 其 他 系统 资源 ， 但 不 能 确保 这 些 资源 〈 及 其 
相关 资源 ) 在 你 认为 该 释放 时 被 释放 ， 那 真 的 很 让 人 头疼 。 
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Rust 不 接受 上 述 任何 一 种 妥协 : 程序 员 应 该 控制 值 的 生命 期 ， 同 时 语言 还 要 确保 安全 。 可 
是 语言 设计 的 这 个 领域 已 经 被 充分 探索 过 了 ， 如 果 不 在 基础 上 做 出 改变 ， 就 很 难 带 来 明显 
的 改进 。 


Rust 以 一 种 非凡 的 方式 打破 僵局 ， 即 限制 程序 使 用 指针 的 方式 。 本 章 及 下 一 章 将 具体 介 
这 些 限 制 及 其 背后 的 原理 。 现 在 ， 只 要 知道 你 过 去 习惯 使 用 的 某 些 结构 可 外 
规则 ， 因 此 需要 另 寻 出 路 就 好 了 。 而 这 些 限制 的 净 效 果 ， 就 是 向 混乱 中 引入 足够 的 秩序 ， 
使 Rust 编译 时 检查 能 验证 你 的 程序 不 包含 影响 内 存 安全 的 错误 : 悬空 指针 、 重 复 释 放 、 使 
用 未 初始 化 的 内 存 ， 等 等 。 在 运行 时 ， 指 针 就 是 单纯 的 内 存 地 址 ， 跟 C 和 C++ 中 的 一 样 。 
区 别 在 于 你 的 代码 已 经 通过 了 安全 检查 。 


同样 的 规则 也 构成 了 Rust 支持 安全 并 发 编程 的 基础 。 使 用 Rust 精心 设计 的 线程 原 语 
(Primitive) ， 确 保 你 的 代码 正确 使 用 内 存 的 规则 ， 同 样 也 能 避免 数据 争 用 。Rust 程序 中 的 
一 个 bug 不 会 导致 一 个 线程 破坏 另 一 个 线程 的 数据 ， 也 不 会 在 无 关 的 地 方 引 入 难以 复 现 的 
错误 。 多 线程 代码 固有 的 不 确定 性 行为 通过 互 斥 量 、 消 息 通 道 、 原 子 值 等 这 些 专门 设计 的 
特性 得 以 隔离 ， 而 不 是 以 赤裸 裸 的 内 存 引 用 存在 。C 和 C++ 的 多 线程 代码 饱 受 诉 病 ，Rust 
则 打 了 一 个 漂亮 的 翻身 仗 。 

eB en ts eno dl dl ho nin 
你 仍然 会 发 现 几 乎 对 任何 任务 来 说 ， 这 门 语言 都 足够 灵活 。 而 为 了 获得 这 些 好 处 (系统 性 
消灭 内 存 管 理 和 并 发 的 各 类 bug) 必须 做 出 的 编程 风格 上 的 改变 是 绝对 值得 的 。 之 所 以 看 
好 Rust， 恰 恰 是 因为 我 们 拥有 多 年 的 C 和 C++ 背景 。 如 果 让 我 们 选 ， 那 想 都 不 用 想 ， 就 
选 Rust。 

Rust 的 规则 你 可 能 在 其 他 任何 语言 中 都 没 见 过 。 依 我 们 看 ， 学 习 Rust 的 关键 就 在 于 理解 
和 利用 好 这 些 规则 | 本 章 先 在 分 析 其 他 语言 中 同样 问题 的 基础 上 给 出 Rust 的 规则 。 然 后 再 
进一步 解释 Rust 的 规则 。 最 后 会 谈 一 谈 某 些 异 常 和 准 异 常 。 


4.1 所 有 权 


如 果 你 读 过 比较 多 的 C 或 C++ 代码 ， 那 可 能 看 到 过 有 注释 解释 说 某 个 类 的 实例 拥有 它 所 
指向 的 一 些 其 他 对 象 。 这 种 情况 通常 意味 着 拥有 对 象 来 决定 什么 时 候 释放 它 所 有 的 对 象 ， 
即 在 所 有 者 被 销毁 的 时 候 ， 它 也 会 销毁 与 之 相关 的 资源 。 


比如 ， 有 如 下 C++ 代码 : 


std::string s = "frayed knot"; 


这 里 的 字符 串 s 在 内 存 中 的 表示 如 图 4-1 所 示 。 
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4-1: 栈 中 的 C++ std: :string 值 指向 堆 中 的 缓冲 区 


在 此 ， 实 际 的 std: :string 对 象 本 身 始终 是 3 个 字 长 ， 包 括 一 个 指向 堆 缓 冲 区 的 指针 、 缓 冲 
区 的 总 容量 (也 就 是 在 分 配 更 大 的 缓冲 区 之 前 ， 它 所 能 容纳 的 文本 的 最 大 长 度 ) 和 当前 保存 
的 文本 的 长 度 。 它 们 都 是 std: :string 类 的 私有 字段 ， 这 个 字符 串 的 用 户 是 访问 不 到 的 。 


std::string 拥有 自己 的 缓冲 区 : 当 程 序 销毁 这 个 字符 串 时 ， 字 符 串 的 析 构 函数 会 释放 该 
缓冲 区 。 过 去 ， 有 的 C++ 库 会 让 多 个 std: :string 值 共 享 同一 个 缓冲 区 ， 并 通过 引用 计数 
来 决定 何 时 释放 缓冲 区 。 较 新 版 本 的 C++ 规范 实际 上 禁止 这 么 做 ， 因 此 所 有 比较 新 的 C++ 
库 都 使 用 如 图 所 示 的 实现 。 在 这 种 情况 下 ， 虽 然 其 他 代码 也 可 以 创建 一 个 指向 同一 缓冲 
区 的 临时 指针 ， 但 该 代码 必须 负责 在 内 存 所 有 者 销毁 所 有 的 对 象 之 前 先 销毁 那些 指针 。 。 
如 ， 可 以 创建 一 个 指向 std: :string 缓冲 区 的 字符 的 指针 ， 但 在 整个 字符 串 被 销毁 后 ， 这 
个 指针 就 无 效 了 ， 你 必须 确保 自己 不 再 使 用 这 个 指针 。 a 
其 他 代码 必须 遵从 所 有 者 的 决定 。 


Rust 从 这 些 注 释 中 提炼 出 规则 ， 并 明确 在 语言 中 加 入 相应 限制 。 在 Rust 中 ， 每 个 值 
都 只 有 一 个 决定 其 生命 期 的 所 有 者 。 当 这 个 所 有 者 被 释放 [用 Rust 的 话说 是 被 清除 
(dropped)] 时 ， 基 所 有 的 值 也 会 被 清除 。 这 些 规 则 旨 在 让 开发 者 通过 六 览 代码 就 能 看 出 
任何 值 的 生命 期 ， 并 赋予 开发 者 对 这 些 值 的 生命 期 的 控制 权 。 而 这 都 是 作为 一 门 系统 编程 
语言 应 该 提供 的 。 
变量 拥有 它 的 值 。 当 控制 流离 开 声 明 变 量 的 代码 块 时 ， 变 量 被 清除 ， 因 此 变量 的 值 也 会 随 
之 被 清除 。 比 如 : 
fn print_ padovan() { 
Let mut padovan = vec![1,1,1]; // 分 配 
for i in 3..10 { 


Let next = padovan[i-3] + padovan[i-2]; 
padovan.push(next); 





































































































printLn!("P(1..10) = {:?}", padovan); 
} // 清除 





这 里 变量 padovan 的 类 型 是 std: :vec::Vec<i32>， 即 32 位 整数 的 向 量 。 在 内 存 中 ，padovan 
最 终 的 值 如 图 4-2 所 示 。 
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4-2: 栈 中 的 vec<32> 指向 堆 中 的 缓冲 区 


这 跟前 面 C++ std::string 值 的 内 存 表示 非常 类 似 ， 只 不 过 这 里 缓冲 区 中 的 元 素 是 32 位 
数值 ， 而 不 是 字符 。 注 意 ， 表 示 padovan 指针 、 容 量 和 长 度 的 3 个 字 直 接 保存 在 print_ 
padovan 图 数 的 栈 帧 中 ， 只 有 向 量 的 缓冲 区 分 配 在 堆 上 。 


与 前 面 的 字符 串 s 类 似 ， 这 里 的 向 量 拥有 保存 其 元 素 的 缓冲 区 。 当 变量 padovan 在 函数 底 
部 超出 作用 域 时 ， 程 序 会 清除 这 个 向 量 。 由 于 向 量 拥有 甚 缓冲 区 ， 因 此 该 缓冲 区 也 一 并 被 
清除 。 


Rust 的 Box 类 型 可 以 作为 所 有 权 的 另 一 个 例子 。Box<T> 是 一 个 指针 ， 其 指向 存储 在 堆 中 的 
T 类 型 的 值 。 调 用 Box: :new(v) 会 在 堆 上 分 配 相 应 的 空间 ， 并 将 值 v 转移 进去 ， 最 后 返回 
一 个 指向 该 堆 空 间 的 Box。 因 为 Box 拥有 它 指向 的 空间 ， 所 以 当 Box 被 清除 时 ， 其 指向 的 
空间 也 会 被 清除 。 
比如 ， 可 以 像 下 面 这 样 在 堆 中 分 配 一 个 元 组 : 
{ 
Let point = Box::new((0.625, 0.5)); // 分 配 point 
Let label = format!("{:?}", point); // 分 配 Label 


assert_ eq!(label, "(0.625, 0.5)"); 
} // 两 者 都 被 清除 


程序 在 调用 Box: :new 时 ， 会 在 堆 上 为 两 个 f64 值 的 元 组 分 配 空间 ， 然 后 将 参数 (9.625， 
9.5) 转移 过 去 ， 最 后 返回 指向 该 空间 的 指针 。 当 控制 流 到 达 assert_eq! 调用 时 ， 栈 帧 如 
4-3 所 示 。 
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图 4-3: 两 个 局 部 变量 ， 其 分 别 拥 有 各 自 的 堆 空 间 
这 里 的 栈 帧 本 身 保存 着 变量 point 和 LabeL， 它 们 分 别 引用 自己 拥有 的 堆 空 间 。 当 这 两 个 
变量 被 清除 时 ， 对 应 的 堆 空间 也 会 被 清除 。 


与 变量 拥有 自己 的 值 一 样 ， 结 构 体 也 拥有 自己 的 字段 。 相 应 地 ， 元 组 、 数 组 和 向 量 则 拥有 
自己 的 元 素 : 


struct Person { name: String, birth: i32 } 














Let mut composers = Vec::new(); 
composers.push(Person { name: "Palestrina".to_string(), 
birth: 1525 }); 
composers.push(Person { name: "Dowland".to_string(), 
birth: 1563 }); 
composers.push(Person { name: "Lully".to_string(), 
birth: 1632 }); 
for composer in &composers { 
println!("{}, born {}", composer.name, composer .birth); 


} 


这 时 ，composers 是 一 个 vec<Person>， 即 一 个 结构 体 的 向 量 ， 每 个 结构 体 分 别 保存 一 个 字 
符 串 和 数值 。 在 内 存 中 ， 最 终 的 composers 值 如 图 4-4 所 示 。 
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图 4-4; 复杂 一 点 的 所 有 权 树 











这 里 涉及 多 个 所 有 权 关 系 ， 但 每 个 都 很 清晰 : composers 拥有 一 个 向 量 ， 而 向 量 拥 有 自己 
的 元 素 ， 每 个 元 素 都 是 一 个 Person 结构 体 ， 而 每 个 结构 体 又 拥有 自己 的 字段 ， 其 中 字符 
串 字段 拥有 自己 的 文本 。 当 控制 流离 开 声明 composers 的 作用 域 时 ， 程 序 会 清除 自己 的 值 ， 
并 清除 与 之 相关 的 所 有 内 存 空间 。 假 如 这 张 图 里 有 其 他 集合 ， 比 如 HashMap 或 BTreesSet， 


意思 也 是 一 样 的 。 


此 时 ， 后 退 一 步 ， 想 一 想 目前 展示 的 所 有 权 关 系 会 带 来 什么 结果 。 每 个 值 都 只 有 一 个 所 有 
者 ， 因 此 决定 何 时 清除 它 很 容易 。 但 是 ， 一 个 值 可 能 拥有 多 个 其 他 值 ， 比 如 composers 向 
量 就 拥有 多 个 元 素 。 而 这 些 值 同样 可 能 再 拥有 自己 的 值 ， 比 如 composers 的 每 个 元 素 都 拥 
有 一 个 字符 串 ， 每 个 字符 串 又 各 自 拥有 自己 的 文本 。 


换 名 话说 ， 可 以 通过 树 来 描述 所 有 权 关系 : 你 的 所 有 者 是 你 的 父 节 点 ， 你 拥有 的 值 是 你 
的 子 节 点 ， 每 个 树 的 根 市 点 则 是 某 一 个 变量 。 当 控制 流 超出 了 这 个 变量 所 在 的 作用 域 时 ， 
整个 树 都 会 被 清除 。 仍 以 composers 的 所 有 权 树 为 例 ， 但 这 个 树 并 不 是 搜索 数据 结构 中 
的 “ 树 ” 或 者 HTML 文档 的 DOM 元 素 树 的 概念 ， 而 是 基于 混合 类 型 构建 的 一 棵 树 ， 且 严 
格 遵守 Rust 的 单一 所 有 者 规则 ， 禁 止 任何 形式 的 结构 再 连接 〈 否 则 就 不 是 纯粹 的 树 了 )。 
Rust 程序 中 的 每 一 个 值 都 是 某 棵 树 的 成 员 ， 都 可 以 追溯 到 某 个 根 变量 。 


Rust 程序 通常 根本 不 会 明确 地 清除 值 ， 即 不 会 像 在 C 和 C++ 中 使 用 free 和 delete 那样 。 
在 Rust 中 ， 清 除 某 个 值 某 种 意义 上 是 通过 将 其 从 所 有 权 树 中 删除 实现 的 。 比 如 ， 离 开 了 茶 
个 变量 的 作用 域 或 者 从 向 量 中 删除 了 一 个 元 素 之 类 的 。 此 时 ，Rust 确保 相应 的 值 及 其 一 众 
资源 都 会 被 正确 清除 。 

从 某 种 角度 看 ，Rust 似乎 不 如 其 他 语言 强大 : 因为 几乎 所 有 其 他 实用 的 编程 语言 都 允许 开 
发 者 构建 任意 形式 的 对 象 图 谱 ， 对 象 之 间 可 以 相互 任意 引用 。 但 恰恰 因为 Rust 在 这 方面 不 
够 强大 ， 才 使 得 它 对 程序 所 能 进行 的 分 析 可 以 更 强大 。Rust 的 安全 性 应 该 正 是 源 自 这 种 代 
码 中 实体 关系 的 可 追踪 性 。 这 是 前 面 提 到 的 Rust“ 激 进 赌注 ”的 一 部 分 。 事 实 上 ，Rust 宣 
称 即便 施加 了 这 样 的 限制 ， 人 们 照样 可 以 在 解决 问题 时 拥有 足够 的 灵活 性 ， 找 到 足够 完美 
的 解决 方案 。 
虽说 如 此 ， 上 述 规则 仍然 有 点 太 严 苛 了 。Rust 从 几 个 方面 对 此 进行 了 扩展 。 


。 可 以 把 值 从 一 个 所 有 者 转移 到 另 一 个 所 有 者 ， 从 而 方便 构建 、 重 塑 和 销毁 关系 树 。 

。 标准 库 提 供 了 基于 引用 计数 的 指针 类 型 Rc 和 Arc， 使 用 它们 可 以 在 满足 某 些 限制 条 件 
的 前 提 下 将 值 指定 给 多 个 所 有 者 。 

。 对 一 个 值 ， 可 以 “借用 其 引用 "。 引 用 是 生命 期 有 限 的 非 所 有 指针 。 

以 上 策略 都 为 所 有 权 模型 注入 了 灵活 性 ， 同 时 也 支持 了 Rust 的 承诺 。 接 下 来 ， 我 们 将 依次 

介绍 它们 ， 但 引用 会 放 在 下 一 章 介 绍 。 


4.2 转移 


在 Rust 中， 对 多 数 类 型 而 言 ， 给 变量 赋值 、 给 函数 传 值 或 从 函数 返回 值 这 样 的 操作 不 会 复 
制 值 ， 而 是 转移 (move) 值 。 所 谓 转 移 ， 就 是 原来 的 所 有 者 让 渡 这 个 值 的 所 有 权 给 目标 所 
有 者 ， 并 变 成 未 初始 化 状态 。 然 后 ， 由 目标 所 有 者 控制 这 个 值 的 生命 期 。Rust 程序 会 以 每 
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次 一 个 值 、 每 次 转移 一 个 的 形式 构造 和 拆 解 复杂 的 结构 。 

有 人 可 能 惊讶 于 Rust 会 改变 如 此 基础 性 操作 的 含义 。 没 错 ， 赋 值 在 这 个 历史 当 口 应 该 具有 
相当 明确 的 含义 。 可 是 ， 如 果 你 仔细 分 析 儿 种 不 同 语言 处 理 赋值 的 方式 ， 就 会 发 现 现 实 中 
已 经 存在 明显 不 同 的 风格 了 。 比 较 下 来 ， 你 会 发 现 Rust 之 所 以 选择 如 此 ， 其 用 意 和 重要 性 
也 是 显而易见 的 。 

先 来 看 看 下 面 的 Python 代码 : 


'udon', 'ramen', 'soba'] 








每 个 Python 对 象 都 带 有 一 个 引用 计数 ， 记 录 当 前 正在 引用 它 的 值 的 数量 。 因 此 ， 在 给 s 赋 
值 后 ， 上 面 这 段 代码 的 状态 如 图 4-5 所 示 (注意 有 些 字段 被 忽略 了 )。 
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图 4-5， Python 字符 串 列表 在 内 存 中 的 表示 


因为 只 有 s 指向 列表 ， 所 以 列表 的 引用 计数 为 1。 而 又 因为 列表 是 唯一 指向 字符 串 的 对 象 ， 
所 以 每 个 字符 串 的 引用 计数 也 是 1。 

当 程 序 执行 到 t 和 vu 的 赋值 时 会 怎么 样 ? Python 对 这 两 个 赋值 的 实现 是 让 目标 变量 指向 
与 源 变量 相同 的 对 象 ， 同 时 递增 该 对 象 的 引用 计数 。 因 此 这 段 程序 最 终 的 状态 如 图 4-6 
所 示 。 
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图 4-6: 在 Python 中 把 s 赋值 给 t 和 v1 之 后 的 结果 


Python 把 指针 从 s 复制 到 了 t 和 u， 并 把 列表 的 引用 计数 更 新 为 3。Python 的 赋值 代价 很 
小 ， 因 为 它 创建 了 一 个 指向 对 象 的 新 引用 ， 但 同时 又 必须 维护 引用 计数 ， 以 便 知 道 何 时 可 
以 释放 这 个 值 。 
接 下 来 再 看 看 类 似 的 C++ 代码: 

Using namespace std; 

vector<string> s = { "udon", "ramen", "soba" }; 


vector<string> 七 = s; 
vector<string> U = s; 


图 4-7 展示 了 s 的 原始 值 在 内 存 中 的 样子 。 























图 4-7: C++ 字符 串 向 量 在 内 存 中 的 表示 
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当 程 序 将 s 赋值 给 t 和 u 时 会 发 生 什 么 ? C++ 中 对 std: :vector 赋值 会 产生 该 向 量 的 副 
本 ，std::string 的 赋值 也 类 似 。 因 此 当 上 面 的 代码 执行 之 后 ， 内 存 中 会 出 现 3 个 向 量 、9 
个 字符 串 ， 如 图 4-8 所 示 。 




















图 4-8: 在 C++ 中 把 s 赋值 给 + 和 之 后 的 结 


根据 值 的 类 型 和 大 小 ，C++ 中 的 赋值 可 能 会 消耗 较 多 内 存 和 处 理 器 时 间 。 然 而 ， 这 样 实现 
的 优点 在 于 程序 容易 决定 何 时 释放 这 些 内 存 : 只 要 变量 超出 作用 域 ， 在 此 分 配 的 空间 都 会 
自动 被 清理 。 
从 某 种 意义 上 讲 ，C++ 和 Python 在 此 选择 了 相反 的 思路 : Python 赋值 代价 小 ， 引 用 计数 
(一 般 情 况 下 是 垃圾 收集 ) 相对 麻烦 ;C++ 保证 了 内 存 所 有 权 的 清晰 ， 代 价 是 赋值 要 深度 
复制 对 象 。C++ 程序 员 对 这 个 选择 经 常 不 大 认同 ， 因 为 深 复制 消耗 大 ， 而 且 通 常 都 有 更 实 
用 的 替代 方案 。 
那么 ， 类 似 的 程序 在 Rust 中 是 什么 样 的 ? 来 看 以 下 代码 : 

Let s = vec!["udon".to_string(), "ramen".to_string(), "soba".to_string()]; 

Let 七 = s; 

Let U = S; 
与 C 和 C++ 类 似 ，Rust 会 把 "udon" 这 种 纯 字 符 串 字面 量 放 到 只 读 内 存 中 。 为 了 与 前 面 
C++ 和 Python 的 例子 作 比 较 ， 这 里 调用 to_string 得 到 了 分 配 在 堆 内 存 上 的 String 值 。 
由 于 Rust 对 向 量 和 字符 串 的 表示 与 C++ 类似 ， 因 此 初始 化 s 之 后 的 状态 看 起 来 也 跟 C+ 
一 样 ， 如 图 4-9 所 示 。 
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前 面 说 过 ，Rust 中 大 多 数 类 型 的 赋值 是 把 值 从 源 变 量 转移 到 目标 变量 ， 然 后 产 变 量变 成 未 
初始 化 状态 。 因 此 ， 初 始 化 t 之 后 ， 程 序 的 内 存 如 图 4-10 所 示 。 
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4-10: 在 Rust 中 把 s 赋值 给 t 之 后 的 结果 


有 什么 不 同 ? 初始 化 代码 let t = s; 把 向 量 的 3 个 头 部 字段 从 s 转移 到 了 t， 然 后 t 就 拥有 
了 这 个 向 量 。 这 个 向 量 的 元 素 仍然 待 在 原 处 ， 字 符 串 也 没 动 。 每 个 值 依旧 只 有 一 个 所 有 者 ， 
只 不 过 转 了 一 手 。 此 时 也 没有 引用 计数 需要 调整 。 而 编译 器 现在 会 认为 s 尚未 初始 化 。 
那么 执行 下 一 行 初始 化 代码 let u = s; 时 会 发 生 什么 ?会 把 未 初始 化 的 值 s 赋 给 u。Rust 
对 使 用 未 初始 化 的 值 非常 慎重 ， 因 此 编译 器 拒绝 执行 这 行 代码 并 报 出 以 下 错误 : 


error[E0382]: use of moved vaLue: “s. 
--> ownership_double move.rs:9:9 





8 Let ts: S32 
9 Utet: WE:s3 


| 

| 

| - Value moved here 

| 

| ^ vaLue used here after move 
| 

















总 结 一 下 Rust 使 用 转移 之 后 的 结果 。 与 Python 类 似 ， 赋 值 代价 很 小 : 程序 仅仅 把 3 个 字 
的 向 量 头 部 从 一 个 地 方 转移 到 了 另 一 个 地 方 。 而 且 也 与 C++ 类 似 ， 所 有 者 始终 很 清晰 : 程 
序 不 需要 引用 计数 或 垃圾 收集 ， 就 可 以 知道 什么 时 候 释 放 向 量 元 素 及 其 字符 串 内 容 。 

而 代价 呢 ? 就 是 如 果 你 需要 这 些 值 的 副本 ， 必 须 明确 生成 。 假 如 你 最 终 想 要 得 到 跟 C++ 程 
序 一 样 的 状态 ， 即 让 每 个 变量 都 单独 持 有 各 自 独立 的 结构 ， 就 必须 调用 向 量 的 clone 方法 ， 
这 个 方法 会 对 向 量 及 其 元 素 执 行 深 复制 |: 























Let s = vec!["udon".to_string(), "ramen".to_string(), "soba".to_string()]; 
Let t = s.clone(); 
let U = s.clone(); 


当然 ， 也 可 以 再 现 Python 的 行为 ， 只 要 使 用 Rust 的 引用 计数 的 指针 类 型 即 可 ， 稍 后 4.4 
节 将 讨论 。 
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4.2.1 更 多 转移 操作 


前 面 的 例子 只 是 展示 了 变量 初始 化 ， 即 在 进入 作用 域 时 通过 let 语句 给 变量 提供 一 个 值 。 
而 给 变量 赋值 还 有 点 不 一 样 ， 体 现在 向 已 经 初始 化 的 变量 转移 值 的 时 候 。 这 时 候 ，Rust 会 
清除 这 个 变量 之 前 的 值 。 比 如 : 

Let mut s = "Govinda".to_string(); 

s = "Siddhartha" .to_string(); // 值 "Govinda" 在 这 里 被 清除 


这 里 ， 程 序 在 将 字符 串 "siddhartha" 赋值 给 s 时 ， 它 之 前 的 值 "Govinda" 会 先 被 清除 。 再 
看 这 个 例子 : 


let mut s = "Govinda".to_string(); 
let t= s; 
s = "Siddhartha" .to_string(); // 这 里 没有 值 被 清除 


这 一 次 , t 取得 了 原来 s 的 字符 串 的 所 有 权 。 因 此 接 下 来 给 s 赋值 时 ，s 是 未 初始 化 的 。 在 
这 种 情况 下 ， 就 没有 字符 串 被 清除 了 。 

目前 为 止 ， 我 们 只 举 了 初始 化 和 赋值 的 例子 ， 因 为 这 两 个 操作 简单 。 但 在 Rust 中 ， 儿 乎 
任何 使 用 值 的 地 方 ， 都 适用 于 转移 这 个 语义 。 给 函数 传递 参数 会 将 所 有 权 转 移 给 函数 的 参 
数 ， 从 函数 返回 值 会 将 所 有 权 转 移 给 调用 代码 ， 构 建 元 组 也 会 把 值 转移 到 元 组 中 ， 等 等 。 


明白 了 这 些 ， 应 该 就 更 容易 理解 本 章 第 一 节 的 示例 代码 了 。 比 如 ， 在 构建 音乐 家 
(composer) 向 量 时 ， 代 码 是 这 样 写 的 : 


struct Person { name: String, birth: i32 } 









































let mut composers = Vec::new(); 
composers.push(Person { name: "Palestrina".to_string(), 
birth: 1525 }); 


这 几 行 代码 中 就 有 几 个 地 方 涉及 转移 ， 当 然 不 包括 初始 化 和 赋值 。 

口 从 函数 返回 值 
调用 Vec: :new() 构建 一 个 新 向 量 并 和 返回， 注意 不 是 指向 这 个 向 量 的 指针 ， 而 是 向 量 本 
身 。 换 句 话 说， 新 向 量 的 所 有 权 会 从 Vec: :new 转移 到 变量 composers。 类 似 地 ， 调 用 
to_string 方法 也 会 返回 一 个 全 新 的 String 实例 。 

口 构建 新 值 

新 Person 结构 体 的 name 字段 会 以 to_string 返回 的 值 初 始 化 。 这 个 结构 体 取 得 新 字符 
串 的 所 有 权 。 

口 给 函数 传 值 
整个 Person 结构 体 ， 而 不 止 是 一 个 指针 ， 被 传递 给 了 向 量 的 push 方法 ， 结 果 是 把 结构 
体 转移 到 了 向 量 的 末尾 。 向 量 取 得 了 Person 的 所 有 权 ， 因 而 也 就 成 了 name 字段 String 
的 间接 所 有 者 。 

像 这 样 把 值 转移 来 转移 去 听 起 来 似乎 效率 不 高 ， 但 要 记 住 两 点 。 首 先 ， 转 移 的 并 不 是 值 所 

拥有 的 堆 内 存 上 的 内 容 ， 而 只 是 特征 值 (value proper)。 对 向量 和 字符 串 来 说 ， 特 征 值 是 





















































只 有 3 个 字 的 头 部 ， 相 对 来 说 大 得 多 的 元 素数 组 和 文本 缓冲 区 仍然 待 在 它们 在 堆 里 原来 的 
位 置 。 其 次 ，Rust 编译 器 在 生成 代码 时 能 够 “看 罕 ” 所 有 这 些 转移 ， 实 践 中 ， 这 意味 着 在 
机 器 码 中 值 通 常会 直接 保存 在 拥有 它 的 变量 旁边 。 


4.2.2 ”转移 与 控制 流 

前 面 例子 中 的 控制 流 都 非常 简单 ， 在 复杂 代码 中 转移 的 语义 是 如 何 实现 的 呢 ? 基本 的 原则 
就 是 ， 如 果 一 个 变量 的 值 已 经 被 转移 了 ， 而 且 转 移 后 始终 未 得 到 新 值 ， 那 么 这 个 变量 就 被 
认为 是 未 初始 化 的 。 比 如 ， 一 个 变量 必须 在 if 语句 求 值 前 后 始终 有 值 ， 才 可 以 在 两 个 分 
支 中 同时 使 用 它 : 


let x = vec![10, 20, 30]; 





















































if cf{ 
F(X ff 在 这 里 转移 x 的 值 没 问题 
} elsef{ 


g(xX); A// ee 在 这 里 转移 x 的 值 也 没 问题 
} 
h(x) // 不 行 : 任何 一 个 分 支 转移 x 后 ，x 在 这 里 就 变 成 未 初始 化 了 
出 于 类 似 的 原因 ， 循 环 体内 的 转移 也 是 被 禁止 的 : 


Let x = vec![10，20，30]; 
while f() { 
g(x); // 不 行 : x 的 值 在 第 一 次 迄 代 时 就 被 转移 了 ， 
// 第 二 次 迭代 时 它 就 变 成 未 初始 化 了 








} 
换 名 话说， 除非 在 下 次 和 迭代 前 给 它 一 个 新 值 : 


Let mut x = vec![10, 20, 30]; 





while f() { 
g(x); // x 的 值 被 转移 了 
x = h(); // 给 x 一 个 新 值 
el(x); 


4.2.3 转移 与 索引 内 容 
前 面 提 到 转移 会 导致 源 变量 变 成 未 初始 化 状态 ， 因 为 目标 变量 会 取得 原始 值 的 所 有 权 。 然 
而 ， 并 不 是 任何 类 型 的 值 都 可 以 随意 变 成 未 初始 化 状态 。 比 如 ， 来 看 如 下 代码 : 

// 构建 一 个 字符 串 向 量 : "101"、"102"……"105" 

Let mut v = Vec::new(); 


for i in 101 .. 106 { 
v.push(i.to_string()); 




















} 

// 从 向 量 中 取得 随机 值 
Let third = v[2]; 

Let fifth = v[4]; 


如 果 让 以 上 代码 运行 ，Rust 则 必须 记 住 向 量 的 第 三 个 和 第 五 个 元 素 已 经 变 成 未 初始 化 了 ， 
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而 且 这 个 信息 要 一 直 记 录 到 向 量 被 清除 。 最 常见 的 处 型 





方式 是 让 向 量 本 身 携 带 额 外 的 信 


息 ， 用 于 记录 哪个 元 素 可 以 用 ， 哪 个 元 素 则 已 经 变 成 未 初始 化 了 。 但 对 于 一 门 系统 编程 语 
言 来 说 ， 这 显然 不 是 正确 的 做 法 。 向 量 就 是 向 量 ， 不 应 该 携带 多 余 的 信息 。 事 实 上 ，Rust 
在 运行 前 面 的 代码 时 会 给 出 如 下 错误 : 











error[E0507]: cannot move out of indexed content 
--> ownership _ move out of vector.rs:14:17 


14 let third = v[2]; 


| 

| 

| 八 八 八 八 

| | 

| help: consider using a reference instead “`“&v[2] 
| cannot move out of indexed content 


对 于 fifth 也 一 样 。 在 上 面 的 错误 消息 中 ， 如 果 你 只 想 访问 元 素 而 不 想 转移 它 的 值 ， 那 
么 Rust 建议 使 用 引用 。 一 般 来 说 ， 我 们 确实 只 想 访问 元 素 而 不 想 转 移 值 。 但 如 果真 的 想 
要 转移 向 量 元 素 的 值 怎 么 办 ? 那 就 需要 采用 规避 这 种 类 型 限制 的 方法 。 以 下 是 3 个 可 能 
的 方案 : 



































// 构建 一 个 字符 串 向 量 : "101"、"102"……"105" 

Let mut v = Vec::new(); 

for i in 101 .. 106 { 
v.push(i.to_string()); 


} 


// 1. 从 向 量 末 尾 取 值 : 
Let fifth = v.pop().unwrap(); 
assert_ eq!(fifth, "105"); 








// 2. 从 向 量 中 间 取 值 ， 同 时 用 最 后 一 个 元 素 填充 : 
let second = v.swap_remove(1); 
assert_eq!(second, "102"); 


// 3. 用 其 他 值 来 交换 要 取出 的 值 : 
Let third = std::mem::replace(&mut v[2], "substitute".to_string()); 
assert_eq!(third, "103"); 


// 看 看 向 量 还 剩 什么 内 容 吧 


assert_eq!(v, vec!["101", "104", "substitute"]); 

















上 国 


i 的 方法 都 可 以 从 向 量 中 转移 出 值 来 ， 而 且 每 种 方法 都 能 保证 向 量 是 被 填 满 的 状态 ， 











小 由 








| 没关系 。 


类 似 Vec 这 样 的 集合 类 型 一 般 会 提供 方法 ， 方 便 在 循环 中 使 用 其 所 有 元 素 : 


Let v = vec!["liberté".to_ string(), 
"égalité".to_string(), 
"fraternité".to_string()]; 

for mut s inv{ 

s.push('!'); 
println!("{}", s); 


变 





在 把 向 量 直 接 传递 给 循环 时 ， 比 如 这 里 的 for ... in v, 会 把 向 量 从 v 中 转移 出 来 ， 导 致 
v 变 成 未 初始 化 。 而 for 循环 内 部 的 机 制 会 取得 向 量 的 所 有 权 ， 并 逐个 迭代 其 元 素 。 每 次 
迁 代 ， 循 环 都 会 将 一 个 元 素 转移 到 变量 s 中 。 因 为 s 拥有 当前 的 字符 串 ， 所 以 循环 体内 的 
代码 可 以 在 打印 之 前 修改 它 。 而 由 于 向 量 本 身 对 代码 不 再 可 见 ， 因 此 循环 期 间 无 法 观察 到 
它 半空 的 状态 。 

如 果 你 发 现 要 从 中 转移 出 值 的 所 有 者 是 编译 器 无 法 跟踪 的 ， 可 以 考虑 改变 所 有 者 的 类 型 ， 
让 自己 可 以 动态 跟踪 它 是 否 还 有 值 。 比 如 ， 以 下 是 前 面 的 一 个 示例 的 另 一 种 写法 : 


struct Person { name: Option<String>, birth: i32 } 





















































let mut composers = Vec::new(); 
composers.push(Person { name: Some("Palestrina".to_string()), 
birth: 1525 }); 


不 能 这 样 做 ， 
Let first_name = composers[0].name; 
因为 会 引起 跟前 面 一 样 的 “cannot move out of indexed content” (不 能 转移 索引 内 容 ) 错 


误 。 但 是 ， 因 为 这 里 把 name 字段 的 类 型 由 String 改 成 了 0ption<String>， 所 以 也 就 意味 
着 None 是 该 字段 可 以 拥有 的 一 个 有 效 值 。 因 此 ， 可 以 这 样 做 : 


let first name = std::mem::repLace(&mut composers[0].name, None); 
assert eq!(first name, Some("Palestrina".to_string())); 
assert_eq!(composers[0].name, None); 


这 里 replace 调用 转移 出 了 composers[9].name 的 值 ， 并 把 None 补充 回去 ， 然 后 将 原始 值 
的 所 有 权 传 递 给 了 其 调用 者 。 事 实 上 ， 像 这 样 使 用 0ption 类 型 是 非常 常见 的 ， 于 是 该 类 型 
干脆 专门 为 此 提供 了 一 个 名 为 take 的 方法 。 因 此 实现 前 面 的 操作 可 以 像 下 面 这 样 把 代码 写 
得 更 简洁 

Let first_name = composers[0].name.take(); 


这 里 调用 take 的 结果 跟前 面 调 用 replace 一 样 。 


4.3 “Copy 类 型 : 转移 的 例外 

目前 为 止 本 书 所 举例 子 中 涉及 的 值 包括 向 量 、 字 符 串 和 其 他 可 能 占用 较 多 内 存 且 复制 起 来 
比较 耗 时 的 类 型 。 转 移 让 这 些 类 型 的 所 有 者 保持 请 晰 ， 赋 值 代价 也 小 。 但 对 于 整数 或 字符 
这 些 比较 简单 的 类 型 ， 这 种 小 心 愤 又 的 处 理 就 真 的 没 必要 了 。 

下 面 比较 一 下 String 赋值 与 132 赋值 在 内 存 中 的 差异 : 


Let str1 = "somnambulance".to_string(); 
let str2 = stri; 



























































let num1: i32 = 36; 
Let num2 = num1; 


运行 以 上 代码 后 ， 内 存 如 图 4-11 所 示 。 
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4-11: 字符 串 赋值 会 转移 值 ，i32 赋值 则 会 复制 值 


与 前 面 的 向 量 一 样 ， 赋 值 把 str1 转移 到 str2， 因 此 不 会 出 现 两 个 字符 串 释 放 相 同 的 缓冲 
区 的 情况 。 但 numl 和 num2 就 不 一 样 了 。i32 只 是 内 存 中 的 一 种 位 模式 ， 它 不 拥有 任何 堆 
中 的 资源 ， 或 者 说 除了 所 包含 的 字 节 外 ， 它 什么 也 没有 。 那 么 在 向 num2 转移 其 位 时 ， 就 把 
num1 完整 复制 了 一 份 。 


转移 值 会 导致 源 变量 变 成 未 初始 化 。 虽 然 将 str1 视 为 无 值 ， 将 numl 视 为 无 意义 的 确 很 重 
要 ， 但 继续 使 用 它 没什么 坏处 。 对 数值 来 说 ， 转 移 的 好 处 不 仅 无 法 体现 ， 反 而 会 导致 不 便 。 
前 面 我 们 也 谨慎 地 说 过 ， 大 多 数 类 型 会 转移 。 那 么 现在 就 来 说 说 例外 ， 即 Rust 选 定 为 
Copy 类 型 。Copy 类 型 的 赋值 会 复制 值 ， 而 不 是 转移 值 。 赋 值 的 源 变量 仍然 是 初始 化 且 可 用 
的 ， 值 也 跟 先 前 一 样 。 将 copy 类 型 的 值 传递 给 函数 和 构造 函数 也 类 似 。 


标准 的 Copy 类 型 包括 所 有 机 器 整数 和 学 点 数值 类 型 、char 和 boot 类 型 ， 以 及 其 他 几 种 类 
型 。Copy 类 型 的 元 组 或 固定 大 小 的 数组 本 身 也 是 Copy 类 型 。 


只 有 可 以 简单 地 位 到 位 复制 的 类 型 才 是 Copy 类 型 。 正 如 前 面 解释 的 ，String 不 是 Copy 类 
型 ， 因 为 它 拥有 分 配 在 堆 上 的 缓冲 区 。 基 于 同样 的 原因 ，Box<T> 也 不 是 Copy 类 型 ， 因 为 
它 拥有 自己 分 配 在 堆 上 的 引用 值 。 表 示 操 作 系统 文件 勾 柄 的 File 类 型 也 不 是 Copy 类 型 ， 
复制 这 种 类 型 的 值 等 于 让 操作 系统 再 打开 一 个 文件 勾 柄 。 类 似 地 ， 表 示 加 锁 后 的 互 斥 量 的 
MutexGuard 类 型 也 不 是 Copy 类 型 : 复制 这 种 类 型 没什么 意义 ， 因 为 一 个 线程 一 次 只 能 有 一 
个 互 斥 量 。 

有 一 条 经 验 规 则 ， 就 是 任何 在 值 被 清除 后 需要 特殊 处 理 的 类 型 都 不 能 是 Copy 类 型 。 比 如 ， 
Vec 需要 释放 其 元 素 ，File 需要 关闭 其 文件 勾 柄 ， 而 MutexGuard 需要 解锁 其 互 斥 量 。 这 些 
类 型 的 位 到 位 的 复制 ， 会 导致 编译 器 分 不 清 哪 个 值 应 该 对 原始 的 资源 负责 。 


那么 用 户 自 定义 的 类 型 呢 ? 默认 情况 下 ，struct 和 enum 类 型 不 是 Copy 类 型 ; 


struct LabeL { number: u32 } 

































































fn print(L: Label) { println!("STAMP: {}", Ll.number); } 
let L = Label { number: 3 }; 


print(1); 
println!("My label number is: {}", Ll.number); 


以 上 代码 无 法 通过 编译 ，Rust 会 报告 如 下 错误 : 





error[E0382]: use of moved value: `L.number 
--> Ownership_struct.rs:12:40 


全 print(1); 
- VvaLue moved here 


| 
| 
| 

12 | println!("My LabeL number is: {}", Ll.number); 
| ^^^AAAA^ value used here after move 
| 


note: move occurs because `L has type ‘main::Label’, which does not 
implement the ‘Copy™ trait 


因为 Label 不 是 Copy 类 型 ， 所 以 把 这 种 类 型 的 值 传 给 print 会 把 值 的 所 有 权 转 移 给 print， 
而 print 会 在 返回 之 前 将 该 值 清除 。 但 这 样 做 有 点 傻 ，Label 其 实 就 是 一 个 带 点 装饰 的 
u32。 设 有 理由 把 1 传 给 print 还 要 转移 值 。 


但 用 户 定义 的 类 型 默认 属于 非 Copy 类 型 。 如 果 自 定义 结构 体 的 所 有 字段 本 身 都 是 Copy 类 型 ， 
那 可 以 在 定义 上 方 添加 #[derive(Copy，Clone)] 属性 把 这 个 类 型 标注 成 Copy 类 型 ， 比 如 : 


#[derive(Copy, Clone)] 
struct Label { number: u32 } 


这 样 一 来 ， 代 码 就 可 以 编译 通过 了 。 对 于 并 非 所 有 字段 都 是 Copy 类 型 的 结构 体 ， 就 算 加 这 
个 属性 也 不 管用 。 编 译 以 下 代码 : 


#[derive(Copy, Clone)] 
struct StringLabel { name: String } 


会 引发 以 下 错误 : 


error[E0204]: the trait ‘Copy. may not be implemented for this type 
--> ownership_string_label.rs:7:10 


| 
7 | #[derive(Copy, Clone)] 


| 八 八 八 八 


8 | struct StringLabel { name: String } 
| this field does not impLement ‘Copy. 


为 什么 不 让 用 户 定义 的 类 型 自动 就 是 copy 且 默 认 符合 条 件 呢 ? 因为 一 个 类 型 是 不 是 Copy， 
对 于 什么 样 的 代码 可 以 使 用 它 有 很 大 影响 。Copy 类 型 更 灵活 ， 因 为 赋值 及 相关 操作 不 会 导 
致 原始 变量 未 初始 化 。 但 对 于 类 型 实现 者 来 说 ， 反 之 亦 然 : Copy 类 型 非常 受 限 制 ， 因 为 它 
能 包含 的 类 型 很 少 ， 不 像 非 Copy 类 型 那样 可 以 使 用 堆 空 间 且 拥有 其 他 资源 。 因 此 把 某 种 类 
型 实现 为 Copy 类 型 ， 对 于 实现 者 而 言 意味 着 庄严 的 承诺 : 若 日 后 有 必要 将 其 改 为 非 Copy 
类 型 ， 那 用 到 它 的 代码 ， 很 多 可 能 需要 重 写 。 


虽然 C++ 支持 重 载 赋 值 操作 符 和 定义 特殊 的 复制 、 移 动 构造 函数 ， 但 Rust 并 不 允许 这 种 
自 定义 。 在 Rust 中， 所 有 转移 都 是 字 节 对 字 节 的 浅 复 制 ， 会 导致 源 变量 未 初始 化 。 复 制 
也 一 样 ， 只 不 过 源 变量 会 保持 初始 化 。 当 然 ， 这 意味 着 C++ 类 能 够 提供 Rust 类 型 无 法 提 
供 的 方便 接口 ， 看 起 来 普 普 通通 的 代码 就 可 以 隐 式 调整 引用 计数 ， 将 开销 大 的 复制 操作 延 
后 ， 或 者 使 用 其 他 复杂 的 实现 技巧 。 

但 对 于 一 门 语言 来 说 ，C++ 的 这 种 灵活 性 会 导致 赋值 、 传 参 和 函数 返回 值 变 得 不 好 预测 。 
比如 ， 本 章 前 面 的 例子 展示 了 在 C++ 中 将 一 个 变量 赋值 给 另 一 个 可 能 会 占用 任意 内 存 空 间 
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和 处 理 器 时 间 。Rust 的 一 个 原则 就 是 ， 开 销 应 该 对 程序 员 显而易见 。 基 本 的 操作 必须 保持 
简单 。 潜 在 开销 大 的 操作 应 该 明确 ， 比 如 在 前 面 的 例子 中 调用 clone 会 对 向 量 及 其 包含 的 
字符 串 执行 深 复 制 。 

本 证 从 一 个 类 型 应 该 具有 的 特征 角度 大 概 地 讨论 了 Copy 和 Clone。 而 实际 上 ， 它 们 都 是 特 
型 (trait) 的 例子 。 特 型 是 Rust 的 开放 式 机 制 ， 用 于 根据 可 以 对 数据 执行 什么 操作 来 对 它 
们 进行 分 类 。 第 11 童 将 介绍 特 型 ， 第 13 章 则 专门 介绍 Copy 和 Clone。 


4.4 ”Rc 和 Arc: 共享 所 有 权 


尽管 典型 的 Rust 代码 中 的 大 多 数值 拥有 唯一 的 所 有 者 ， 但 在 某 些 情况 下 很 难 找到 每 个 值 只 
有 一 个 所 有 者 时 所 需 的 生命 期 。 你 可 能 希望 某 个 值 在 所 有 操作 都 完成 时 再 被 清除 。 对 此 ， 
Rust 提供 了 基于 引用 计数 的 指针 类 型 Rc 和 Arc。 正 如 Rust 所 承诺 的 ， 这 两 种 类 型 可 以 安 
全 使 用 。 放 心 ， 你 不 会 忘记 调整 引用 计数 ， 不 会 对 Rust 未 关注 的 值 创建 指针 ， 也 不 会 因为 
C++ 中 那些 与 引用 计数 指针 相关 的 问题 而 碰 到 麻烦 。 

Rc 和 Arc 类 型 非常 相似 ， 唯 一 的 区 别 在 于 Arc (Arc 是 atomic reference count， 即 原子 引用 
计数 的 简写 ) 可 以 在 线程 间 安全 共享 ，Rc 则 会 使 用 更 快 的 非 线程 安全 的 代码 更 新 其 引用 
计数 。 如 果 不 需 要 在 线程 间 共享 指针 ， 则 没 必要 承担 Arc 带 来 的 性 能 开销 ， 就 用 RC 即 可 ; 
Rust 会 阻止 跨 线 程 传递 它 。 除 此 之 外 ， 这 两 种 类 型 是 等 价 的， 因此 本 节 后 面 就 只 讨论 Rc。 
本 章 前 面 展示 了 Python 使 用 引用 计数 管理 其 值 的 生命 期 的 例子 。 在 Rust 中 ， 可 以 使 用 Rc 
达成 类 似 的 效果 。 来 看 如 下 代码 : 


use std::rc::Rc; 




















































































































// Rust 可 以 推断 所 有 这 些 类 型 ， 这 里 写 出 来 是 为 了 清楚 
let s: Rc<String> = Rc::new("shirataki".to_string()); 
Let t: Rc<String> = s.clone(); 

let u: Rc<String> = s.clone(); 


对 于 任意 类 型 T，Rc<T> 值 是 一 个 指针 ， 指 向 堆 空 间 中 的 T 值 ， 同 时 该 值 有 一 个 附属 的 引用 
计数 。 对 Rc<T> 调用 clone 方法 不 会 复制 T， 只 会 创建 另 一 个 指向 它 的 指针 并 给 引用 计数 
加 1。 因 此 ， 前 面 的 代码 执行 后 ， 内 存 会 如 图 4-12 所 示 。 
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3 个 Rc<String> 指针 引用 的 是 同一 块 内 存 ， 其 中 包含 一 个 引用 计数 和 String 的 空间 。 
的 所 有 权 规 则 适用 于 Rc 指针 本 身 ， 当 最 后 一 个 Rc 被 清除 后 ，Rust 也 会 
在 Rc<String> 上 也 可 以 直接 使 用 String 的 所 有 常用 方法 : 


assert!(s.contains("shira")); 
assert eq!(t.find("taki"), Some(5)); 
println!("{} are quite chewy, almost bouncy, but lack flavor", u); 


Rc 指针 拥有 的 值 不 可 修改 。 如 果 要 在 字符 串 末 尾 追 加 一 些 文本 : 
s.push_str(" noodles"); 


Rust 会 拒绝 : 


error: cannot borrow immutable borrowed content as mutable 
--> ownership_rc_mutability.rs:12:5 





2 i s.push_str(" noodles"); 
| ^ cannot borrow as mutable 


Rust 的 内 存 和 线程 安全 保证 有 一 个 前 提 ， 即 不 存在 既 共 享 又 可 以 修改 的 值 。Rust 假设 Rc 指 
针 引 用 的 值 通常 是 共享 的 ， 因 此 应 该 不 可 修改 。 第 5 章 将 解释 为 什么 这 个 限制 很 重要 。 

使 用 引用 计数 管理 内 存 的 另 一 个 众所周知 的 问题 证， 如 有 果 存 在 两 个 引用 计数 的 值 互相 指向 对 
方 ， 则 双方 的 引用 计数 将 始终 大 于 0， 因此 这 两 个 值 将 永远 不 会 被 释放 (如 图 4-13 所 示 )。 


















































图 4-13: 引用 计数 循环 ， 这 两 个 对 象 永远 得 不 到 释放 


在 Rust 中 ， 这 样 的 循环 引用 可 能 导致 内 存 泄漏 ， 但 很 少见 。 因 为 要 创建 循环 引用 ， 必 须 在 
某 个 时 刻 让 旧 值 指向 新 值 。 而 这 显然 要 求 旧 值 必须 可 修改 。 由 于 Rc 指针 引用 的 值 不 可 修 
改 ， 因 此 正常 情况 是 不 可 能 创建 循环 的 。 不 过 ，Rust 确实 支持 给 不 可 修改 的 值 创 建 可 修改 
的 部 分 ， 这 个 能 力 叫 内 部 修改 能 力 (interior mutability) ，9.9 节 将 介绍 。 如 果 同 时 使 用 该 技 
术 和 Rc 指针 ， 是 可 以 创造 循环 引用 并 导致 内 存 泄 漏 的 。 

有 时 候 ， 可 以 使 用 弱 指 针 (weak pointer) std::rc: :Weak 取代 一 些 链接 以 避免 创建 Rc 指针 
的 循环 。 不 过 ， 本 书 不 会 涉及 相关 内 容 ， 有 具体 细节 可 以 参考 标准 库 的 文档 。 


转移 和 引用 计数 指针 是 两 种 缓和 所 有 权 树 严 奇 局 面 的 方式 。 下 一 章 将 介绍 第 三 种 方式 : 借 
用 对 某 个 值 的 引用 。 熟 悉 了 所 有 权 和 借用 的 概念 之 后 ， 才 算是 跨 过 了 学 习 Rust 的 门槛 ， 之 
后 就 可 以 专注 于 利用 它 的 独特 优势 了 。 
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第 5 章 


5| 用 





能 力 不 足 ， 怨 不 得 书 。 





Mark Miller 


目前 为 止 我 们 看 到 的 所 有 指针 类 型 ， 包 括 Box<T> 堆 指 针 以 及 String、Vec 值 内 部 的 指针 ， 
都 是 所 有 型 指针 。 这 意味 着 当 所 有 者 被 清除 时 ， 引 用 的 资源 也 会 随 之 清除 。Rust 也 有 一 种 
非 所 有 型 指针 类 型 ， 叫 作 引 用 (reference)， 这 种 指针 对 它 所 引用 资源 的 生命 期 没有 影响 。 


事实 上 ， 人 恰恰 相反 : 引用 的 生命 期 不 能 超过 其 引用 的 资源 。 换 句 话 说 ， 代 码 中 引用 的 生存 
期 不 能 超过 它 指 向 的 值 ， 必 须 让 这 一 点 在 代码 中 显而易见 。 为 强调 这 一 点 ，Rust 把 创建 对 
某 个 值 的 引用 称 作 借用 (borrow) 这 个 值 : 借 的 东西 ， 迟 早 要 还 给 它 的 所 有 者 。 

如 果 看 到 “必须 让 这 一 点 在 代码 中 显而易见 ”这 和 句 话 你 有 所 怀疑 ， 这 很 正常 。 引 用 本 身 没 
什么 特别 的 ， 说 到 底 ， 引 用 就 是 地 址 。 只 不 过 Rust 保证 引用 安全 的 规则 是 比较 新 奇 的 ， 纵 
观 同 类 语言 ， 应 该 说 史 无 先 例 。 虽 然 这 些 规则 属于 Rust 中 最 难 掌 握 的 部 分 ， 但 它们 可 以 神 
奇 地 帮 你 避免 名 式 各 样 、 天 天 都 会 有 的 bug， 而 且 对 于 多 线程 编程 也 具有 人 解放 意义 。 同 样 ， 
这 又 是 Rust 激进 的 赌注 。 

来 看 一 个 例子 。 假 设 我 们 想 做 一 个 包含 文艺 复兴 时 期 艺术 家 及 其 知名 作品 的 表 。Rust 标准 
库 有 一 个 散 列 表 类 型 ， 基 于 它 可 以 创建 我 们 的 自 定义 类 型 : 


use std::collections::HashMap; 























type Table = HashMap<String, Vec<String>>; 


换 名 话说， 这 是 一 个 把 String 值 映射 到 vec<String> 值 的 散 列表 ， 可 以 根据 艺术 家 的 名 字 
找到 对 应 的 作品 。 可 以 使 用 for 循环 迭代 HashMap， 因 此 ， 为 了 调试 我 们 写 一 个 函数 来 打 
印 Table 的 内 容 : 
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fn show(table: TabLe) { 
for (artist, works) in table { 
println!("works by {}:", artist); 
for work in works { 
printLn!("” {}", work); 
} 


} 
构建 和 打印 这 个 表 很 简单 : 


fn main() { 
let mut table = Table::new(); 
table.insert("Gesualdo".to_string(), 
vec!["many madrigals".to_string(), 
"Tenebrae Responsoria".to_string()]); 
table.insert("Caravaggio" .to_string(), 
vec!["The Musicians".to_string(), 
"The Calling of St. Matthew".to_string()]); 
table.insert("Cellini".to_string(), 
vec!["Perseus with the head of Medusa" .to_string()， 
"a salt ceLLar" .to_string()]); 





show(table); 
} 


运行 也 一 切 正常 : 


$ cargo run 
Running `/home/jimb/rust/book/fragments/target/debug/fragments. 
works by Gesualdo: 
Tenebrae Responsoria 
many madrigals 
works by Cellini: 
Perseus with the head of Medusa 
a salt cellar 
works by Caravaggio: 
The Musicians 
The Calling of St. Matthew 


$ 
但 是 ， 如 果 你 看 过 前 一 章 关于 转移 的 讨论 ， 那 么 应 该 会 对 show 的 定义 产生 几 个 疑问 。 特 别 
地 ，HashMap 不 是 Copy， 因 为 它 拥 有 动态 分 配 的 表 。 所 以 当 程 序 执行 到 show(table) 时 ， 整 
个 结构 都 会 转移 到 函数 中 ， 变 量 table 变 成 了 未 初始 化 。 如 果 此 时 代码 再 尝试 使 用 table， 
就 会 出 问题 : 








show(table); 
assert_eq!(table["Gesualdo"][0], "many madrigals"); 


Rust 提醒 table 的 值 已 经 不 存在 了 : 


error[E0382]: use of moved value: ‘table. 
--> references_show moves_table.rs:29:16 
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28 show(table); 


| 

| 
| vaLue moved here 

29 | assert_eq!(table["Gesualdo"][0], "many madrigals"); 
| ^ 人 A^^ vaLue used here after move 

| 


note: move occurs because ‘table. has type “HashMap<String，Vec<String>> ， 
which does not implement the ‘Copy trait 


实际 上 ， 如 果 再 看 一 看 show 的 定义 ， 会 发 现 外 层 for 循环 取得 了 这 个 散 列 表 的 所 有 权 并 用 
尽 了 它 。 内 层 的 for 循环 也 一 样 ， 只 不 过 使 用 的 是 各 个 字符 串 向 量 。(4.2.3 节 的 例子 中 也 
有 过 类 似 的 情况 。) 因为 存在 转移 的 语义 ， 所 以 这 里 打印 完 内 容 之 后 就 把 整个 结构 销毁 了 。 
Rust， 真 有 你 的 ! 


这 里 正确 的 做 法 是 使 用 引用 。 通 过 引用 ， 可 以 访问 值 ， 又 不 会 影响 其 所 有 权 。 引 用 分 两 种 
情况 。 


共享 引用 (shared reference) ， 可 以 读 取 引 用 的 值 ， 但 不 能 修改 。 不 过 ， 你 可 以 拥有 对 基 
个 特定 值 的 任意 多 个 共享 引用 。 表 达 式 &e 会 产生 一 个 对 e 的 值 的 共享 引用 。 如 果 e 的 
类 型 是 T， 那 么 &e 的 类 型 就 是 8T， 读 作 “T 的 引用 ”。 共 享 引用 是 Copy。 

可 修改 引用 (mutable reference)， 可 以 读 取 和 修改 引用 的 值 。 不 过 ， 你 不 能 同时 拥有 对 
该 值 的 任何 其 他 引用 。 表 达 式 &mut e 会 产生 一 个 对 @ 的 值 的 可 修改 引用 。 如 果 把 e 的 
类 型 写作 &mut T， 就 可 以 读 作 “T 的 可 修改 引用 ”。 可 修改 引用 不 是 Copy。 


可 以 将 共享 引用 和 可 修改 引用 的 区 别 理解 为 它们 会 在 编译 时 分 别 执行 多 读 (multiple 
readers) 和 单 写 (single writer) 的 检查 规则 。 事 实 上 ， 这 条 规则 不 仅仅 适用 于 引用 ， 也 适 
用 于 被 借用 值 的 所 有 者 。 只 要 存在 对 某 个 值 的 共享 引用 ， 即 便 该 值 的 所 有 者 也 不 能 修改 
它 。 此 时 的 值 被 锁定 了 。 比 如 ， 在 show 执行 期 间 ， 没 有 人 可 以 修改 table。 类 似 地 ， 如 果 
存在 对 某 个 值 的 可 修改 引用 ， 则 该 引用 对 这 个 值 拥有 排他 读 写 权 。 换 名 话说 ， 在 这 个 可 修 
改 引用 存续 期 间 ， 连 对 应 值 的 所 有 者 你 都 无 法 使 用 。 保 持 共享 引用 和 可 修改 引用 分 开 ,， 是 
保障 内 存 安全 的 基本 前 提 ， 本 章 稍 后 会 进一步 解释 。 

我 们 例子 中 的 打印 函数 不 需要 修改 散 列 表 ， 只 需 读 取 其 内 容 。 因 此 ， 调 用 时 可 以 只 传 入 对 
散 列表 的 共享 引用 : 


show(&table); 


引用 是 非 所 有 型 指针 ， 因 此 table 变量 仍然 是 整个 结构 的 所 有 者 ，show 只 是 借用 一 下 而 
已 。 自 然 ， 还 需要 相应 地 调整 一 下 show 的 定义 ， 不 过 你 得 仔细 看 才能 看 出 差别 来 : 


fn show(table: &Table) { 
for (artist, works) in table { 
println!("works by {}:", artist); 
for work in works { 
printLn!("” {}", work); 




























































































} 
} 


show 的 参数 table 已 经 从 Table 变 成 了 &Table: 以 前 传 的 是 值 (实际 上 是 把 所 有 权 转 移 到 
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函数 中 )， 现 在 传 的 是 共享 引用 。 这 是 代码 中 唯一 要 改动 的 地 方 。 那 么 函数 体 里 不 改 也 
可 以 吗 ? 


首先 ， 原 来 的 外 层 for 循环 在 修改 前 取得 了 HashMap 的 所 有 权 并 使 用 了 它 ， 在 修改 后 则 
得 到 了 对 HashMap 的 一 个 共享 引用 。 返 代 对 HashMap 的 共享 引用 ， 按 照 定 义 会 产生 对 其 中 
每 一 项 键 和 值 的 共享 引用 : artist 从 原来 的 String 变 成 了 &string， 而 works 从 原来 的 
Vec<String> 变 成 了 &Vec<String>。 


内 层 循 环 也 会 发 生 类 似 的 变化 。 和 迭代 对 向 量 的 共享 引用 ， 按 照 定 义 会 产生 对 甚 元素 的 共享 
引用 ， 因 此 work 现在 是 &sString。 此 时 函数 中 没有 发 生 所 有 权 转 手 ， 只 有 非 所 有 型 的 引用 
在 传递 。 
现在 ， 如 果 想 写 一 个 函数 ， 按 字母 表 顺 序 给 每 位 艺术 家 的 作品 排 个 序 ， 那 共享 引用 就 不 行 
了 ， 因 为 共享 引用 不 允许 修改 。 没 错 ， 这 个 排序 函数 需要 取得 散 列表 的 可 修改 引用 : 

fn sort_works(table: &mut Table) { 


for (_artist, works) in table { 
works. sort(); 


























} 
} 


调用 时 要 传 入 它 : 
sort_works(&mut table); 


通过 可 修改 借用 ，sort_works 获得 了 读 取 和 修改 结构 的 能 力 ， 对 向 量 的 sort 方法 来 说 这 是 
必需 的 。 

当 以 转移 所 有 权 的 方式 给 函数 传 参 时 ， 我 们 称 其 为 传 值 (by value)。 如 果 传 给 函数 的 是 对 
值 的 引用 ， 则 称 其 为 传 引 用 (by reference)。 比 如 ， 我 们 修改 了 show 函数 ， 由 原来 给 它 传 
值 改 为 了 传 引用 。 很 多 语言 会 强调 这 个 差异 ， 但 这 对 Rust 而 言 尤 其 重要 ， 因 为 它 体现 了 影 
响 所 有 权 的 不 同方 式 。 


5.1 引用 作为 值 


前 面 的 例子 展示 了 引用 非常 典型 的 使 用 场景 ， 即 让 函数 可 以 访问 或 操作 某 个 结构 ， 但 又 不 


必 取 得 其 所 有 权 。 而 引用 实际 上 比 这 还 要 灵活 ， 本 节 将 通过 几 个 例子 来 说 明 这 一 点 。 
5.1.1 Rust 引 用 与 C++ 引用 


如 果 你 熟悉 C++ 引用 ， 就 会 发 现 它 们 与 Rust 引用 有 一 定 的 共通 之 处 。 最 重要 的 是 ， 它 们 
在 机 器 级 别 上 都 是 地 址 。 而 在 实践 中 ，Rust 引用 给 人 的 感觉 非常 不 一 样 。 


在 C++ 中 ，3 引 | 用 按 惯例 是 隐 式 创建 的 ， 解 引用 也 是 隐 式 的 : 
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// c++ 代码 ! 

int x = 10; 

int &r = x; // 初始 化 时 隐 式 创建 引用 

assert(r == 10); // 隐 式 地 对 r 解 引用 以 读 取 x 的 值 

r = 20; // 把 20 保 存在 x 中 ，r 本 身 仍然 指向 x 
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在 Rust 中 ， 引 用 是 通过 & 操作 符 显 式 创建 的 ， 而 解 引 用 也 要 显 式 使 用 * 操作 符 : 


// 从 这 里 开始 都 是 Rust 代 码 了 
let x = 10; 

let r = &x; // &x 是 对 x 的 共享 引用 
assert!(*r == 10); // 显 式 地 对 r 解 引用 


要 创建 可 修改 引用 ， 则 使 用 &mut 操作 符 : 


let mut y = 32; 

let m = &mut y; // &mut y 是 y 的 可 修改 引用 

xm += 32; // 显 式 地 对 m 解 引用 以 便 设 置 y 的 值 
assert!(*m == 64);  // 读 取 y 的 新 值 同 样 要 显 式 解 引 用 


等 等 ， 还 记得 吗 ， 我 们 在 修改 show 函数 ， 给 它 传 引用 而 不 是 传 值 之 后 ， 并 没有 使 用 * 操作 
符 来 解 引 用 。 这 是 怎么 回 事 ? 
由 于 Rust 代码 中 会 广泛 使 用 引用 ， 因 此 . 操作 符 会 在 必要 时 对 其 左 操作 数 进 行 隐 式 解 引 用 : 


struct Anime { name: &'static str，bechdeL_pass: bool }; 

let aria = Anime { name: "Aria: The Animation", bechdel _pass: true }; 
Let anime ref = &aria; 

assert eq!(anime_ref.name, "Aria: The Animation"); 






































// 等 价 于 上 一 行 代码 ， 只 不 过 把 解 引 用 写 明 了 : 

assert eq!((*anime_ref).name, "Aria: The Animation"); 
前 面 show 函数 中 的 宏 println! 会 扩展 成 使 用 . 操作 符 的 代码 ， 因 此 也 会 利用 该 操作 符 的 
隐 式 解 引 用 。 
除了 隐 式 解 引 用 ，. 操作 符 在 方法 调用 需要 时 还 可 以 隐 式 借用 对 其 左 操作 数 的 引用 。 比 如 ， 
Vec 的 sort 方法 需要 取得 向 量 的 可 修改 引用 ， 此 时 下 面 两 种 调用 方式 是 等 价 的 ， 

Let mut v = vec![1973，1968]; 

v.sort(); // 隐 式 借用 了 对 v 的 可 修改 引用 

(&mut v).sort(); // 等 价 ， 更 难看 
总 结 一 下 ，C++ 会 隐 式 地 在 引用 和 左 值 ( 即 引用 内 存 位 置 的 表达 式 ) 之 间 转 换 ， 这 些 转换 
会 出 现在 任何 需要 用 到 它们 的 地 方 。 而 在 Rust 中 ， 则 必须 使 用 & 和 * 操作 符 来 创建 和 追随 
引用 ， 只 有 . 操作 符 例外 ， 它 会 隐 式 地 借用 和 人 解 引 用 。 


5.1.2 给 引用 赋值 
给 Rust 引用 赋值 会 导致 它 指向 新 值 : 
let x = 10; 


let y = 20; 
let mut r = &x; 












































ifb{r= &y;} 
assert!(*r == 10 || *r == 20); 


引用 r 开始 指向 x， 而 如 果 b 为 true， 它 就 会 指向 y， 如 图 5-1 所 示 。 
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5-1: 引用 现在 指向 了 y 而 不 是 x 
这 跟 C++ 完全 不 同 ， 在 C++ 中 给 引用 赋值 会 将 值 存 储 在 引用 中 。 而 且 ， 没 有 办 法 将 C++ 
引用 指向 初始 值 之 外 的 其 他 地 址 。 


5.1.3 引用 的 引用 
Rust 人 允许 使 用 引用 的 引用 





struct Point { x: i32, y: i32 } 

let point = Point { x: 1000, y: 729 }; 
let r: &Point = &point; 

let rr: &&Point = &r; 

let rrr: &&&Point = &rr; 


(这 里 明确 写 出 了 引用 的 类 型 ， 但 实际 上 是 可 以 省 略 的 ，Rust 可 以 自行 推断 。) 不 管 引 用 了 
多 少 个 引用 ，. 操作 符 都 可 以 顺藤摸瓜 地 找到 最 终 的 值 : 


assert_eq!(rrr.y, 729); 


在 内 存 中 ， 这 几 个 引用 如 图 5-2 所 示 。 








point 
rr rrr 


x yy 
a .| 


5-2: 引用 的 引用 的 链条 
表达 式 rrr.y 按照 rrr 类 型 的 指示 ， 会 跨越 3 层 引 用 找到 Point 并 取得 其 y 字段 的 值 。 


5.1.4 比较 引用 
与 . 操作 符 类 似 ，Rust 的 比较 操作 符 也 能 “看 穿 ”任意 多 个 引用 ， 只 要 两 个 操作 数 的 类 型 
相同 即 可 


Let x = 10; 
let y = 10; 














let rx = &x; 
let ry = &y; 
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Let rrx = &rx; 
let rry = &ry; 


assert!(rrx <= rry); 
assert!(rrx == rry); 


最 后 一 个 断言 会 成 功 ， 即 使 rrx 和 rry 指向 不 同 的 值 ( 即 rx 和 ry)， 因 为 == 操作 符 会 跟随 
所 有 3 引用， 对 它们 的 最 终 目标 x 和 y 进行 比较 。 基 本 上 这 正 是 我 们 所 希望 的 ， 特 别 是 在 编 
写 泛 型 函数 时 。 如 果 确 实 想 比 较 两 个 引用 是 不 是 指向 同一 块 内 存 ， 可 以 使 用 std: :ptr::eq， 
这 个 方法 比较 引用 的 地 址 : 


assert!(rx == ry); // 它们 引用 的 值 相等 
assert!(!std::ptr::eq(rx, ry)); // 但 两 个 值 不 在 一 个 地 址 


5.1.5 引用 永远 不 为 空 

Rust 引用 永远 不 为 空 。 没 有 跟 C 的 NULL 或 C+ 的 nullptr 对 应 的 东西 存在 。 引 用 没有 默 
认 的 初始 值 (无 论 什么 类 型 的 变量 ,在 其 初始 化 之 前 都 不 能 使 用 )。 而 且 ，Rust (在 unsafe 
代码 外 部 ) 不 会 将 整数 转换 为 引用 ， 因 此 不 能 把 0 转换 成 引用 。 


C 和 C++ 代码 经 常 使 用 空 指针 表示 某 个 值 不 存在 。 比 如 ，mattoc 函数 可 能 返回 指向 一 块 新 
内 存 的 指针 ， 也 可 能 在 内 存 不 足 时 返回 nutlptr。 而 在 Rust 中 ， 如 果 你 需要 一 个 要 么 是 引 
用 要 么 什么 也 不 是 的 值 ， 那 就 使 用 Option<8T>。 在 机 器 级 别 ，Rust 将 None 表示 为 空 指针 ， 
将 Some(r) (其 中 r 是 8T 值 ) 表示 为 非 零 地 址 。 因 此 0ption<8T> 完全 可 以 像 C 或 CH+ 中 
的 空 指针 一 样 有 效 ， 但 更 安全 ， 它 的 类 型 要 求 你 在 使 用 之 前 必须 检查 它 是 否 为 None。 


5.1.6 借用 对 任意 表达 式 的 引用 
与 C 和 C++ 只 允许 对 某 些 类 型 的 表达 式 应 用 & 操作 符 不 同 ，Rust 允许 你 借用 对 任何 类 型 
表达 式 的 值 的 引用 


fn factorial(n: usize) -> usize { 
(1..n+1).fold(1, |a, bl a * b) 















































Let r = &factorial(6); 
assert eq!(r + &1009, 1729); 


在 类 似 这 种 情况 下 ，Rust 会 创建 一 个 匿名 变量 来 保存 表达 式 的 值 ， 然 后 生成 一 个 指向 该 值 
的 引用 。 这 个 匿名 变量 的 生命 期 取决 于 你 会 对 引用 做 什么 。 


。 如 果 你 在 tet 语句 中 立即 把 这 个 引用 赋 给 一 个 变量 (或 将 其 变 成 立即 被 赋值 的 结构 体 或 
数组 的 一 部 分 )， 那 Rust 会 让 这 个 匿名 变量 具有 与 tet 初始 化 的 变量 一 样 长 的 生命 期 。 
在 前 面 的 例子 中 ,r 会 一 直 引 用 对 应 的 匿名 变量 。 
否则 ， 匿 名 变量 会 存活 至 闭合 语句 的 末尾 。 对 我 们 的 例子 而 言 ， 用 于 保存 1699 的 匿名 
变量 只 会 存活 至 assert_eq! 语句 结束 。 


如 果 你 对 C 或 C++ 比较 了 解 ， 可 能 会 觉得 这 样 容易 出 问题 。 但 是 不 要 忘 了 ，Rust 永远 不 
会 让 你 的 代码 中 出 现 悬 空 指 针 。 如 果 有 超出 匿名 变量 生命 期 且 永 远 不 会 用 到 的 引用 存在 ， 
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Rust 一 定 会 在 编译 时 发 现 并 报告 它 。 你 只 要 把 匿名 变量 的 值 保存 到 一 个 命名 变量 中 并 给 它 
一 个 适当 的 生命 期 即 可 。 


5.1.7 ”对 切片 和 特 型 对 象 的 引用 

目前 为 止 我 们 看 到 的 引用 全 部 是 简单 的 地 址 。 然 而 ，Rust 也 有 两 种 胖 指 针 (fat pointer)， 
即 包含 某 个 值 的 地 址 以 及 与 使 用 该 值 相关 的 必要 信息 的 一 个 两 个 字 的 值 。 

对 切片 的 引用 是 一 个 胖 指针 ， 包 含 切片 地 址 及 其 长 度 信息 。 第 3 章 详细 介绍 过 切片 。 

Rust 的 另 一 种 胖 指 针 是 特 型 对 象 (trait object) ， 即 对 实现 某 种 特 型 的 一 个 值 的 引用 。 特 型 
对 象 包含 一 个 值 的 地 址 和 一 个 指向 与 该 值 匹 配 的 特 型 实现 的 指针 ， 以 便于 调用 特 型 的 方 
法 。11.1.1 节 将 详细 介绍 特 型 对 象 。 

除了 携带 这 些 额 外 的 数据 ， 切 片 和 特 型 对 象 的 引用 与 本 章 的 其 他 引用 没什么 不 同 : 它们 都 
不 拥有 自己 指向 的 值 ， 它 们 的 生命 期 都 不 能 超出 目标 值 ， 它 们 可 以 是 可 修改 的 或 共享 的 ， 


短 短 
可 可 


5.2 引用 安全 


正如 你 所 看 到 的 ， 引 用 与 C 或 C++ 中 的 普通 指针 非常 相似 。 但 这 种 指针 是 不 安全 的 ，Rust 
是 怎么 控制 引用 的 呢 ? 解释 规则 的 最 好 方式 或 许 就 是 打破 规则 。 我 们 先 从 最 简单 的 例子 开 
始 ， 然 后 逐步 增加 复杂 性 并 解释 原因 。 


5.2.1 借用 局 部 变量 


下 面 是 一 个 非常 明显 的 例子 。 不 能 借用 对 一 个 局 部 变量 的 引用 ， 然 后 将 其 拿 到 该 变量 的 作 
用 域 之 外 : 












































{ 
let r; 
let x= 1; 
『 = &xX; 
} 
assert_ eq!(*r, 1); // bad: reads memory ‘x used to occupy 
} 


Rust 编译 器 拒绝 了 这 上段 程序 ， 并 给 出 了 详细 的 错误 消息 : 


error: ‘x does not Live long enough 
--> references_dangling.rs:8:5 


| 
7 | rT = &x; 
| - borrow occurs here 
8 | } 
| ^ ‘x dropped here while still borrowed 
9 | assert eq!(*r, 1); // bad: reads memory ‘x Used to occupy 
10 | } 
| 


- borrowed vaLue needs to live until here 
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Rust 抱怨 的 是 x 只 存活 到 内 部 块 的 末尾 ， 引 用 却 存 活 到 了 外 部 块 的 末尾 ， 变 成 了 悬空 指 
针 ， 这 是 不 允许 的 。 

虽然 这 段 程序 无 法 执行 的 原因 对 人 类 而 言 显而易见 ， 但 还 是 有 必要 看 一 看 Rust 是 怎么 得 出 
这 个 结论 的 。 即 便 是 这 么 简单 的 例子 ， 也 可 以 帮 我 们 理解 Rust 检查 更 复杂 代码 时 所 用 到 的 
逻辑 工具 。 


Rust 会 给 程序 中 的 每 个 引用 类 型 附加 一 个 生命 期 (lifetime)， 生 命 期 的 长 短 与 如 何 使 用 该 
引用 匹配 。 生 命 期 是 程序 中 可 以 安全 使 用 引用 的 一 个 范围 ， 比 如 一 个 词法 块 、 一 个 语句 、 
一 个 表达 式 、 某 个 变量 的 作用 域 ， 等 等 。 生 命 期 完全 是 Rust 在 编译 时 虚构 的 东西 。 而 在 运 
行 时 ， 引 用 就 是 一 个 地 址 ， 甚 生命 期 取决 于 自身 的 类 型 ， 疫 有 运行 时 表示 。 


在 上 面 的 例子 中 ， 有 3 个 生命 期 的 关系 需要 搞 清 楚 。 变 量 r 和 x 都 有 生命 期 ， 始 于 它们 被 
初始 化 ， 止 于 离开 它们 的 作用 域 。 第 三 个 生命 期 是 一 个 引用 类 型 的 生命 期 ， 即 借用 &x 并 
保存 在 r 中 的 引用 的 生命 期 。 


下 面 是 一 个 看 起 来 显而易见 的 约束 : 对 于 变量 x 的 引用 不 能 比 x 本 身 还 “长 寿 ”， 如 图 5-3 
所 示 。 




















&x 的 生命 期 一 定 


不 能 超出 这 个 范围 





assert_eq!(*r，1); 











图 5-3: &x 可 能 的 生命 其 
离开 x 的 作用 域 之 后 ， 对 它 的 引用 会 变 成 悬空 指针 。 为 此 ， 我 们 说 变量 的 生命 期 必须 包含 
或 涵盖 从 它 那 里 借 来 的 引用 的 生命 期 。 


下 面 再 看 另 一 个 约束 : 保存 在 变量 r 中 的 引用 ， 其 类 型 必须 保证 它 在 变量 的 整个 生命 期 都 
有 效 ， 自 初始 化 始 ， 至 离开 作用 域 止 ， 如 图 5-4 所 示 。 

















保存 在 "中 的 任何 值 的 生命 棚 
都 必须 至 少 涵盖 这 个 范围 
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如 有 果 引 用 不 能 至 少 与 保存 它 的 变量 一 样 “ 长 寿 "， 那 么 上 在 某 个 时 刻 就 会 成 为 悬空 指针 。 
为 此 ， 我 们 说 引用 的 生命 期 必须 包含 或 涵盖 保存 它 的 变量 的 生命 期 。 

上 述 第 一 个 约束 限制 引用 的 生命 期 可 以 有 多 长 ， 而 第 二 个 约束 限制 引用 的 生命 期 可 以 有 多 
短 。Rust 只 要 找到 一 个 同时 满足 这 两 个 约束 的 生命 期 即 可 。 可 是 ， 在 我 们 的 例子 中 没有 这 
样 一 个 生命 期 ， 如 图 5-5 所 示 。 






























不 存在 一 个 生命 期 既 


完全 涵盖 这 个 范围 …… 




















图 5-5: 引用 的 生命 期 约束 存在 冲突 


现在 来 看 一 个 可 以 满足 上 述 约 束 的 不 同 的 例子 吧 。 约 束 还 跟 之 前 一 样 : 引用 的 生命 期 必须 
包含 在 x 的 生命 期 内 ， 同 时 必须 完全 涵盖 r 的 生命 期 。 由 于 r 的 生命 期 现在 变 短 了 ， 因 此 
就 出 现 了 一 个 满足 约束 的 生命 期 ， 如 图 5-6 所 示 。 

















内 部 的 生命 期 涵盖 r 
的 生命 期 ， 且 包含 
| 在 x 的 生命 期 中 


assert_eq! (*r, 1); 

















图 5-6: 生命 期 包含 " 的 作用 域 ， 同 时 也 在 x 的 作用 域 中 的 引用 


在 从 较 大 数据 结构 中 借用 某 个 部 分 的 引用 时 ， 这 些 规则 会 非常 自然 地 应 用 ， 比 如 借用 向 量 
中 的 元 素 : 

Let v = vec![1, 2, 3]; 

let r = &v[1]; 
由 于 v 拥 有 向 量 ， 而 癌 量 拥有 自己 的 元 素 ， 因 此 v 的 生命 期 必须 涵盖 引用 类 型 &v[1] 的 生 
命 期 。 类 似 地 ， 如 果 把 引用 保存 在 某 个 数据 结构 中 ， 其 生命 期 必须 涵盖 该 数据 结构 的 生命 
期 。 比 如 ， 对 于 一 个 引用 向 量 而 言 ，( 作 为 向 量 元 素 的 ) 所 有 引用 的 生命 期 都 必须 涵盖 拥 
有 这 个 向 量 的 变量 的 生命 期 。 
这 是 Rust 评判 所 有 代码 的 流程 的 本 质 。 无 论 给 语言 增加 什么 新 特性 ， 比 如 数据 结构 或 函数 
调用 ， 都 会 相应 引入 新 的 约束 条 件 。 但 原理 始终 不 变 : 首先 ， 理解 由 程序 使 用 引用 的 方式 
带 来 的 约束 ; 其次， 找到 满足 约束 的 生命 期 。 这 跟 C 和 C++ 程序 员 强 加 给 自己 的 流程 没 
有 太 大 区 别 ; 区 别 仅 在 于 Rust 知道 这 些 规则 ， 并 会 强制 代码 遵守 。 
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5.2.2 ”接收 引用 作为 参数 


在 把 引用 传 给 函数 时 ，Rust 如 何 确保 函数 能 安全 地 使 用 它 ? 假 设 函 数 f 取得 了 一 个 引用 并 
将 其 保存 在 了 一 个 全 局 变量 中 。 整 个 过 程 会 修改 儿 次 ， 先 看 第 一 稿 : 

// 这 段 代 码 有 些 问题 ， 过 不 了 编译 

static mut STASH: &i32; 

fn f(p: &i32) { STASH = p; } 


Rust 中 与 全 局 变量 等 价 的 是 static 变量 : 这 是 一 种 在 程序 启动 时 创建 并 一 直 存 活 到 程序 
终止 时 的 值 。( 跟 其 他 声明 一 样 ，Rust 的 模块 系统 控制 静态 变量 在 哪里 可 见 ， 因 此 这 里 的 
“全 局 ” 指 的 是 它们 的 生命 期 ， 而 不 是 可 见 性 。) 第 8 章 会 介绍 静态 变量 ， 此 处 只 讨论 前 面 
的 代码 违背 的 几 条 规则 。 


所 有 静态 变量 都 必须 初始 化 。 

可 修改 静态 变量 本 质 上 不 是 线程 安全 的 〈 毕 竞 ， 任 何 线程 在 任意 时 刻 都 可 能 访问 静态 变 
量 )， 即 使 在 单线 程 的 程序 中 ， 它 们 也 可 能 成 为 其 他 常见 问题 的 牺牲 品 。 为 此 ， 建 议 只 
在 unsafe 块 中 存 取 可 修改 静态 变量 。 在 这 个 例子 中 ， 我 们 不 关心 那些 特殊 问题 ， 因 此 
可 以 简单 写 个 unsafe 块 ， 然 后 继续 。 


修改 之 后 的 代码 如 下 : 


static mut STASH: &i32 = &128; 
fn f(p: &i32) { // 还 不 够 好 
unsafe { 
STASH = p; 












































} 

} 
这 就 差不多 了 。 要 发 现 剩 下 的 问题 ， 必 须 把 Rust 允许 我 们 省 略 的 一 些 代码 也 写 出 来 。 函 数 
f 的 签名 如 果 完 整地 写 出 来 ， 是 这 样 的 : 

fn f<'a>(p: &'a i32) { ... } 
这 里 ， 生 命 期 'a ( 读 作 “ 撤 A”) 是 f 的 生命 期 参数 (lifetime parameter) ， 其 中 <'a> 相当 
于 “对 于 任意 生命 期 'a”， 因 此 fn f<'a>(p: &'a i32) 表示 这 个 函数 接收 一 个 具有 任意 给 
定 生命 期 'a 的 132 的 引用 。 
由 于 必须 允许 'a 为 任意 生命 期 ， 因 此 如 果 能 让 它 的 生命 期 尽 可 外 
的 调用 ， 事情 就 会 比较 好 办 。 此 时 赋值 就 成 了 焦点 : 

STASH = p; 
因为 STASH 的 生命 期 与 程序 的 整个 执行 过 程 一 样 长 ， 所 以 它 保 存 的 引用 类 型 的 生命 期 也 必 
须 同样 长 才 行 。Rust 称 这 种 生命 期 为 'static 生命 期 。 但 p 的 生命 期 是 'a， 即 任意 长 度 的 
生命 期 ， 只 要 能 涵盖 对 f 的 调用 就 行 。 因 此 ，Rust 拒 绝 编 译 这 段 代 码 : 


error[E0312]: lifetime of reference outlives lifetime of borrowed content... 
--> references_static.rs:6:17 
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| 
6 | STASH = p; 
| 八 





| 
= note: ...the reference is valid for the static lifetime... 
note: ...but the borrowed content is only valid for the anonymous lifetime #1 
defined on the function body at 4:0 
--> references_static.rs:4:1 


| 
4 | / fn flp: &i32) { // 还 不 够 好 
5 | 1 unsafe { 
61|| STASH = p; 
?| } 
8|1|1} 
国医 





此 时 ， 很 明显 我 们 的 函数 不 能 接受 任意 引用 作为 参数 ， 但 应 该 能 够 接受 一 个 具有 'static 
生命 期 的 引用 。 只 有 把 这 样 一 个 引用 保存 在 STASH 中 才 不 会 创建 悬空 指针 。 确 实 ， 下 面 的 
代码 编译 就 通过 了 : 


static mut STASH: &i32 = &10; 








fn f(p: &'static i32) { 
unsafe { 
STASH = p; 
} 
} 


这 次 , f 的 签名 中 加 上 了 p 必须 是 一 个 具有 'static 生命 期 引用 的 限制 ， 因 此 把 它 保存 到 
STASH 中 就 不 会 出 问题 了 。 当 然 ， 这 样 一 改 就 只 能 对 那些 静态 变量 的 引用 使 用 f 了 ， 毕 竞 
只 有 静态 变量 的 引用 才 不 会 导致 STASH 成 为 悬空 指针 。 比 如 ， 可 以 这 样 写 : 


static WORTH_POINTING_AT: i32 = 1000; 
f(&NORTH_POINTING_AT) ; 














既然 NORTH_POINTING_AT 是 静态 的 ，&WORTH_POINTING_AT 的 类 型 是 &'static iti32， 那 把 它 传 
给 f 就 是 安全 的 。 

现在 回头 看 看 在 逐步 修正 代码 的 过 程 中 ,和 的 签名 有 哪些 变化 : 最 初 是 f(p: i32)， 最 终 是 
f(p: &'static i32)。 换 名 话说 ， 在 Rust 中 不 可 能 写 出 与 函数 签名 意图 不 匹配 的 函数 来 ， 
比如 在 最 初 的 写法 下 想 把 引用 保存 到 全 局 变量 中 是 不 可 能 的 。Rust 中 国 数 的 签名 始终 反映 
函数 体 的 行为 。 

相反 ， 如 果真 看 到 一 个 函数 的 签名 是 gl(p: &i32) (或 者 把 生命 期 也 写 出 来 ， 即 9<'a>(Pp: 
&'a i32))， 那 马上 就 可 以 知道 这 个 函数 不 能 把 参数 p 保存 到 生命 期 超出 调用 之 外 的 变量 
里 。 根 本 不 用 看 g 的 定义 ， 只 看 签名 就 知道 9 对 自己 的 参数 能 做 什么 ， 不 能 做 什么 。 这 个 
事实 正 是 确保 函数 调用 安全 的 一 个 基础 。 


5.2.3 将 引用 作为 参数 传递 


前 面 讨论 了 函数 签名 与 函数 体 的 关系 ， 接 下 来 看 看 函数 与 调用 者 的 关系 。 假 设 有 以 下 代码 : 


// 这 个 函数 可 以 简写 成 : fn g(p: &132)， 
// 不 过 ,现在 先 把 生命 期 也 写 上 
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fn g<'a>(p: &'a i32) { ... } 


let x = 10; 

9g(&x) ; 
单 从 9g 的 签名 看 ，Rust 知道 它 不 会 把 p 保存 到 超出 调用 生命 期 的 变量 里 : 任何 涵盖 调用 的 
生命 期 都 满足 'a。 因 此 Rust 在 此 为 &x 选择 了 尽 可 能 短 的 生命 期 对 9 的 调用 。 这 个 生命 
期 满足 所 有 约束 : 没有 超出 x 且 涵 盖 对 9g 的 全 部 调用 。 因 此 代码 顺利 编译 通过 。 
注意 ， 尽 管 g 的 定义 中 包含 生命 期 参数 'a， 但 调用 g 时 并 不 用 管 它 。 一 般 来 说 ， 只 需 在 定 
义 国 数 和 类 型 时 考虑 生命 期 参数 ， 而 在 使 用 它们 时 Rust 会 为 你 推断 生命 期 。 
如 果 把 这 里 的 &x 传 给 前 面 定义 的 把 自己 的 参数 保存 在 静态 变量 里 的 函数 f， 会 怎么 样 ? 

fn f(p: &'static i32) { ... } 











let x = 10; 
f(g&x); 


编译 失败 : 引用 &x 不 能 “ 活 ” 得 比 x 还 长 ， 而 把 它 传 给 f， 会 强迫 它 “ 活 ”得 跟 'static 
一 样 长 。 这 里 没 办 法 做 到 “人 人 满意 ”，Rust 只 能 拒绝 编译 。 


5.2.4 返回 引用 


国 数 中 取得 某 个 数据 结构 的 引用 ， 然 后 返回 对 该 结构 某 一 部 分 的 引用 ， 这 是 很 常见 的 。 比 
如 ， 下 面 的 函数 会 返回 一 个 对 切片 中 最 小 元 素 的 引用 : 


// v 至 少 包含 一 个 元 素 
fn smallest(v: &[i32]) -> &i32 { 
Let mut s = &v[0]; 
for r in &v[1..] { 
ES 











} 


埠 


} 
这 里 像 平常 一 样 简 写 了 函数 的 签名 。 如 果 一 个 函数 接收 一 个 引用 作为 参数 并 返回 一 个 引 
用 ， 那 么 Rust 会 假设 这 两 个 引用 具有 相同 的 生命 期 。 完 整地 写 出 来 就 是: 

fn smallest<'a>(v: &'a [i32]) -> &'a i32{ ...} 


假设 这 样 调用 smallest: 


let s; 
{ 
let parabola = [9, 4, 1, 0, 1, 4, 9]; 
s = smallest(&parabola); 
} 
assert_eq!(*s, 0); // 不 行 : 指向 了 已 被 清除 的 数组 的 元 素 


根据 smallest 的 签名 可 知 其 参数 和 返回 值 必须 有 具有 相同 的 生命 期 'a。 在 上 面 的 调用 中 ， 
参数 &parabola 不 能 “ 活 ” 得 比 parabola 还 长 ， 可 是 smallest 的 返回 值 至 少 要 跟 s 一样 
“长 寿 ”。 此 时 不 存在 能 同时 满足 两 个 约束 的 生命 期 'a， 因 此 Rust 拒绝 编译 : 























88 | 第 5 章 


error: “paraboLa ”does not live long enough 
--> references_Lifetimes_propagated.rs:12:5 


| 
于 下 | s = smallest(&parabola); 
| borrow occurs here 
12 | } 
| ^ “parabola. dropped here while still borrowed 
13 | assert_eq!(*s, 0); // 不 行 : 指向 了 已 被 清除 的 数组 的 元 素 
14 | } 
| 


- borrowed value needs to Live until here 





把 s 挪 一 下 ， 让 它 的 生命 期 明显 包含 在 parabola 的 生命 期 中 ， 问 题 就 解决 了 : 


Let parabola = [9，4，1，0，1，4，9]; 
Let s = smallest(&parabola); 
assert_eq!(*s, 0); // 可 以 : paraboLa 还 活着 


函数 签名 中 的 生命 期 让 Rust 可 以 评估 传递 给 函数 的 引用 和 函数 返回 的 引用 之 间 的 关系 ， 从 
而 确保 安全 地 使 用 它们 。 


5.2.5 ”结构 体 包含 引用 
Rust 如 何 处 理 保存 在 数据 结构 中 的 引用 呢 ? 下 面 的 程序 跟前 面 一 样 也 有 错误 ， 只 不 过 结构 
体 中 包含 了 引用 : 
// 这 段 代码 不 能 通过 编译 
struct S{ 
r: &i32 




















} 
let s; 


let x = 10; 
SE St{ rr x+}; 
} 
assert_eq!(x*s.r，10); // 不 行 : 从 已 被 清除 的 x 中 读 取 


Rust 对 引用 施加 的 安全 约束 不 会 因为 把 引用 藏 在 了 结构 体 中 而 失效 。 实 际 上 ， 这 些 约束 最 
终 也 会 应 用 给 5。 确 实 ，Rust 质疑 了 : 


error[E0106]: missing lifetime specifier 
--> references_in_struct.rs:7:12 





| 
无 r: &i32 
| ^ expected lifetime parameter 
当 引 用 类 型 出 现在 另 一 个 类 型 的 定义 中 时 ， 必 须 写 出 其 生命 期 。 比 如 ， 可 以 这 样 写 : 


struct S 
r: &'static i32 





} 
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这 意味 着 r 只 能 引用 生命 期 与 程序 一 样 长 的 132 值 ， 而 这 个 限制 太 大 了 。 为 此 ， 可 以 为 这 
个 类 型 指定 一 个 生命 期 参数 'a， 并 让 它 作用 于 r: 

struct S<'a> { 

r: &'a i32 

} 
S 类 型 现在 有 了 一 个 生命 期 就 像 引 用 类 型 一 样 。 此 后 ， 每 个 类 型 5 的 值 都 会 有 一 个 新 的 
生命 期 a， 它 会 限制 你 使 用 这 个 值 的 方式 。 保 存在 r 中 的 任何 引用 的 生命 期 最 好 包含 'a， 
而 'a 也 必须 比 保存 5 的 任何 值 都 “长 寿 ”。 
回 到 前 面 的 代码 ， 表 达 式 5 { r: &x } 创建 了 一 个 带 有 生命 期 'a 的 新 5 值 。 在 把 &x 保存 
在 上 字段 中 时 ， 等 于 把 'a 完全 限制 在 了 x 的 生命 期 内 。 
赋值 语句 s = S { ... } 把 这 个 5 保存 在 了 一 个 生命 期 直到 程序 结束 的 变量 中 ， 于 是 要 求 
'a 至 少 跟 s 的 生命 期 一 样 长 。 此 刻 Rust 又 遇 到 了 跟 之 前 一 样 矛 盾 的 限制 : "a 不 能 比 x“ 长 
寿 ”， 但 至 少 要 跟 s 一 样 “ 长 寿 ”。 不 存在 这 样 的 生命 期 ， 所 以 Rust 会 拒绝 编译 。 又 避免 了 
场 灾难 
把 带 有 生命 期 参数 的 类 型 放 到 其 他 类 型 中 又 会 怎样 ? 


struct T{ 
s: S // 这 样 不 行 
































1 








Rust 仍然 会 质疑 ， 就 像 试 图 不 给 5 指定 生命 期 却 要 让 它 包含 引用 一 样 : 


error[E0106]: missing lifetime specifier 
--> references_in nested_struct.rs:8:8 














| 
8 | s: S // 这 样 不 行 
| ^ expected lifetime parameter 
这 里 也 不 能 漏 掉 S 的 生命 期 参数 : Rust 需要 知道 T 的 生命 期 与 它 包含 的 s 中 的 引用 的 生命 
期 是 什么 关系 ， 以 便 对 T 应 用 跟 对 Ss 和 纯 引 用 相同 的 检查 。 
可 以 给 s 声明 'static 生命 期 : 
struct T{ 
s: S<'static> 
} 
这 样 一 来 ，s 字段 就 只 能 借用 那些 在 整个 程序 执行 期 间 都 会 存活 的 值 。 这 样 有 点 受 限 ， 不 
过 确实 意味 着 T 不 可 能 借用 局 部 变量 了 ;， 除 此 之 外 ,， 对 工 的 生命 期 没有 什么 特殊 的 约束 。 
此 外 ， 也 可 以 给 T 一 个 自己 的 生命 期 参数 ， 同 时 传 给 5: 


Struct T<'a> { 
Ss: Se a 








} 


通过 声明 生命 期 参数 'a 并 在 s 的 类 型 中 也 使 用 该 生命 期 ，Rust 就 可 以 将 T 值 的 生命 期 与 
其 Ss 中 所 保存 引用 的 生命 期 关联 起 来 。 
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前 面 展示 过 通过 函数 签名 可 以 知道 给 它 传 什么 引用 。 现 在 又 在 类 型 上 看 到 了 类 似 的 情形 : 
通过 类 型 的 生命 期 参数 ， 可 以 知道 该 类 型 是 否 包含 具有 相应 ( 非 "static) 生命 期 的 引用 ， 
以 及 那些 引用 的 情况 如 何 。 


比如 ,假设 有 一 个 解析 函数 ， 其 参数 是 一 个 字 市 切片 ， 它 会 返回 保存 解析 结果 的 一 个 结构 : 


fn parse_record<'i>(input: &'i [u8]) -> Record<'i>{ ...} 


根本 不 用 去 看 Record 类 型 的 定义 ， 就 可 以 知道 如 果 从 parse_record 接收 到 Record， 那 么 
其 中 包含 的 引用 一 定 指向 我 们 传人 的 输入 缓冲 区 ， 而 不 会 是 别处 ('static 值 除外 )。 
事实 上 ，Rust 之 所 以 要 求 包含 引用 的 类 型 不 能 省 略 生 命 期 参数 ， 正 是 为 了 将 这 种 内 部 行为 
外 化 表示 出 来 。Rust 并 非 不 可 以 给 结构 体 中 的 每 个 引用 构造 生命 期 ， 从 而 帮 你 省 掉 把 它们 
写 出 来 的 麻烦 。Rust 早期 的 版 本 就 是 这 么 做 的 ， 但 开发 者 反映 这 样 比较 乱 : 知道 一 个 值 从 
另 一 个 值 借用 了 什么 还 是 很 有 用 的 ， 特 别 是 在 排 错 的 时 候 。 

不 仅仅 引用 和 像 5 这 样 的 类 型 有 生命 期 ，Rust 中 的 所 有 类 型 都 有 生命 期 包括 132 和 String。 
大 多 数 是 简单 的 'static， 也 就 是 说 ， 你 想 让 它们 的 生命 期 有 多 长 就 有 多 长 。 比 如 ， 一 个 
Vec<i32> 值 ， 它 是 独立 的 ， ee 量 超出 作用 域 时 被 清除 。 但 是 像 vec<&'a 
i32> 这 样 生命 期 必须 包含 在 'a 中 的 类 型 ， 则 必须 在 其 引用 的 值 仍然 有 效 时 先 被 清除 。 


5.2.6 ”不同 的 生命 期 参数 
假设 我 们 定义 了 一 个 结构 体 ， 其 中 包含 两 个 引用 : 


struct S<'a> { 












































x: &'a i32, 
y: &'a i32 
} 
这 两 个 引用 使 用 相同 的 生命 期 'a。 如 果 你 的 代码 想像 下 面 这 样 做 则 可 能 会 有 问题 : 
let x = 10; 
let r; 
{ 
let y = 20; 
let s=S{ x: &x, yy: &y }; 
FS 
} 
} 


以 上 代码 不 会 创建 悬空 指针 。y 的 引用 保存 在 s 中 ， 而 s 会 先 于 y 被 销毁 。x 的 引用 最 终 保 

存在 r 中 ， 而 r 也 不 会 比 x“ 活 ”得 更 外。 

可 是 ， 如 果 你 试图 用 较 早 版 本 的 编译 器 编译 这 段 代 码 ，Rust 就 会 抱怨 说 y“ 活 ”得 不 够 长 ， 

尽管 明显 够 长 。 为 什么 Rust 会 担心 呢 ? 仔细 分 析 一 下 代码 ， 你 会 发 现 它 这 样 做 的 道理 。 

。 5 的 两 个 字段 都 是 引用 , 且 拥 有 相同 生命 期 'a, 因此 Rust 必须 找到 一 个 同时 对 s.x 和 s.y 
都 合适 的 生命 期 。 

。 赋值 r = s.x 要 求 'a 涵盖 Fr 的 生命 期 。 
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以 &y 初始 化 s.y， 要 求 'a 的 生命 期 不 能 长 过 y。 


没有 比 y 的 作用 域 短 却 比 r 的 作用 域 长 的 生命 期 ， 这 两 个 约束 不 可 能 同时 满足 。 于 是 Rust 
停 了 下 来 。 

出 现 这 个 问题 ， 原 因 在 于 s 的 两 个 引用 有 相同 的 生命 期 'a。 修 改 s 的 定义 ， 让 两 个 引用 分 
别 拥有 不 同 的 生命 期 ， 一 切 就 迎刃而解 了 : 


struct S<'a, 'b> { 

















x: &'a i32, 
y: &'b i32 
} 
如 此 一 改 ，s.x 和 s.y 就 有 了 独立 的 生命 期 。 对 s.x 的 操作 不 会 影响 到 s.y， 因 此 前 面 的 约 
束 就 很 容易 满足 了 :“'a 可 以 等 于 r 的 生命 期 ， 而 'b 可 以 等 于 s 的 生命 期 ('b 也 可 以 等 于 


y 的 生命 期 ， 不 过 Rust 倾向 于 选择 可 用 的 最 短 生 命 期 )。 最 终 一 切 都 顺理成章 。 
函数 签名 也 有 类 似 的 作用 。 假 设 有 如 下 函数 : 

fn f<'a>(r: &'a i32, s: &'a i32) -> &'a i32 { r } // 可 能 太 严 苛 了 
这 里 ， 两 个 引用 参数 的 生命 期 都 是 'a， 没 必要 像 前 面 一 样 限制 调用 。 如 果 这 样 确 实 有 问 
题 ， 那 可 以 让 参数 拥有 不 同 的 生命 期 : 

fn f<'a，'b>(r: &'a i32, s: &'b i32) -> &'a i32 {r } // 宽松 多 了 
放宽 限制 的 缺点 在 于 ， 过 多 的 生命 期 参数 会 导致 类 型 和 函数 签名 复杂 难 读 。 作 为 本 书 作者 ， 
我 通常 会 先 尝试 最 简单 的 定义 ， 如 果 编 译 无 法 通过 就 放松 限制 ， 直 到 编译 通过 。 因 为 Rust 不 
会 放 过 不 安全 的 代码 ， 所 以 等 着 它 告诉 你 哪里 有 问题 你 再 修改 是 一 个 完全 可 以 接受 的 策略 。 


5.2.7 ”省略 生 命 期 参数 

到 目前 为 止 ， 本 书展 示 的 很 多 函数 以 引用 为 返回 值 或 参数 ， 但 通常 不 需要 写 出 生命 期 参 
数 。 无 论 写 还 是 不 写 ， 生 命 期 一 直 都 在 。Rust 会 在 生命 期 参数 明显 合理 时 让 你 省 略 它们 。 
在 最 简单 的 情况 下 ， 如 果 函 数 不 返 回 任何 引用 (或 者 其 他 需要 生命 期 参数 的 类 型 )， 那 永 
远 也 不 需要 写 出 参数 的 生命 期 。Rust 会 在 每 个 需要 的 地 方 加 上 明确 的 生命 期 。 比 如 : 


struct S<'a, 'b> { 
x: &'a i32, 
y: &'b i32 
































} 


fn sum_r_xy(r: &i32, s: S) -> i32 { 
r+s.x+s.y 


} 
上 面 函数 的 签名 完整 地 写 出 来 应 该 是 这 样 的 : 
fn sum_r_xy<'a, 'b, 'c>(r: &'a i32, s: S<'b, 'c>) -> i32 


如 果 国 数 确实 要 返回 引用 或 其 他 带 生 命 期 参数 的 类 型 ， 那 Rust 也 会 尽量 让 消除 卜 义 的 过 程 简 
化 。 如 果 函 数 参 数 中 只 出 现 了 一 个 生命 期 ， 那 Rust 会 假定 返回 值 中 的 生命 期 都 是 该 生命 期 : 
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fn first_third(point: &[i32; 3]) -> (&i32, &i32) { 
(&point[0], &point[2]) 


这 个 函数 包含 所 有 生命 期 的 完整 签名 如 下 : 

fn first_ third<'a>(point: &'a [i32; 3]) -> (&'a i32, &'a i32) 
如 果 函 数 参 数 中 有 多 个 生命 期 ， 那 么 自然 没 理由 认为 哪个 生命 期 更 适合 返回 值 ， 此 时 Rust 
会 要 求 你 自己 写 清楚 。 
最 后 ， 还 有 一 种 可 能 的 简写 形式 ， 那 就 是 如 果 函 数 是 某 个 类 型 的 方法 ， 而 它 又 接收 引用 形 
式 的 self 参数 ， 那 么 平衡 就 被 打破 了 : Rust 会 假定 self 的 生命 期 就 是 返回 值 需要 的 生命 
期 。(self 参数 引用 的 是 调用 当前 方法 的 值 ， 相 当 于 C++、Java 或 JavaScript 中 的 this， 
或 者 Python 中 的 self。 关 于 方法 ，9.5 节 会 讨论 。) 
比如 ， 可 以 这 样 写 : 


struct StringTable { 
elements: Vec<String>, 























} 
impl StringTable { 
fn find_by_prefix(&self, prefix: &str) -> Option<&String> { 
for i in 0 .. self.elements.len() { 


if self.elements[i].starts with(prefix) { 
return Some(&self.elements[i]); 


None 


这 里 find_by_prefix 方法 的 完整 签名 如 下 : 
fn find_by_prefix<'a, 'b>(&'a self, prefix: &'b str) -> Option<&'a String> 
Rust 假定 无 论 你 借用 的 是 什么 ， 都 是 从 self 中 借用 的 。 


说 到 底 ， 这 些 简写 形式 就 是 为 了 少 叶 人 。 如 果 简写 不 符合 你 的 预期 ， 那 完全 可 以 自己 明确 
写 出 生命 期 。 


5.3 ”共享 与 修改 


本 书 此 前 讨论 的 都 是 Rust 如 何 确 保 引 用 永远 不 会 指向 已 经 离开 作用 域 的 变量 。 但 是 还 有 别 
的 方式 可 能 引入 悬空 指针 。 比 如 这 样 : 


let v = vec![4, 8, 19, 27, 34, 10]; 














Let r = &v; 
Let aside = v; // 将 向 量 转 移 到 aside 
FLOls // 不 行 : 使 用 v， 可 是 它 已 经 变 成 未 初始 化 了 























给 aside 赋值 会 转移 向 量 ， 导 致 v 变 成 未 初始 化 ， 而 上 也 变 成 了 悬空 指针 ， 如 图 5-7 所 示 。 








栈 帧 





i TELT 


图 5-7: r 引用 的 向 量 已 经 转移 了 
虽然 v 在 r 的 整个 生命 期 内 都 存在 ， 但 问题 是 v 的 值 已 经 转移 到 别处 ，v 变 成 未 初始 化 了 ， 
而 上 还 引用 着 它 。 自 然 ，Rust 也 捕获 了 这 个 错误 : 


error[E0505]: cannot move out of ‘Vv because it is borrowed 
--> references_sharing_vs_mutation_1.rs:10:9 














| 
9 | Let r = &v; 

| - borrow of ‘Vv. occurs here 
10 | Let aside = v; // 将 向 量 移 到 一 边 
| 


^^^A^A^ move out of `v”occurs here 





终 其 整个 生命 期 ， 共 享 引用 的 目标 值 都 是 只 读 的 : 不 能 重新 给 它 赋值 或 转移 该 值 。 而 在 上 
面 的 代码 中 ,r 的 生命 期 内 发 生 了 转移 向 量 的 操作 ，Rust 当然 要 拒绝 。 把 代码 改 成 下 面 








这 




















样 就 没事 了 : 
let v = vec![4, 8, 19, 27, 34, 10]; 
{ 
let r = &v; 
r[0]; // 可 以 : 向 量 没 动 
} 


Let aside = v; 
这 一 次 ,r 先 离 开 作用 域 ， 引 用 的 生命 期 在 v 转移 之 前 结束 ， 一 切 相 安 无 事 。 
下 面 来 看 男 一 种 破坏 方式 。 假 设 有 一 个 函数 ， 它 拿 一 个 切片 的 元 素来 扩展 一 个 向 量 : 


fn extend(vec: &mut Vec<f64>, slice: &[f64]) { 
for elt in slice { 
vec.push(*elt); 





0 





} 
} 


这 是 标准 库 向 量 方法 extend_from_stice 的 缩水 版 ( 少 了 很 多 优化 )。 通 过 它 可 以 基于 别 的 
向 量 或 数组 的 切片 构建 一 个 向 量 : 


let mut wave = Vec::new(); 
let head = vec![0.0, 1.0]; 
let tail = [0.0, -1.0]; 








大 
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extend(&mut wave，&head);  // 用 另 一 个 向 量 扩 展 wave 
extend(&mut wave,，&tail);  // 用 数组 扩展 wave 


assert_eq!(wave, vec![0.0, 1.0, 0.0, -1.0]); 
这 样 就 构造 了 正弦 波 的 一 个 周期 。 如 果 想 再 增加 一 个 波形 ， 能 不 能 追加 向 量 本 身 呢 ? 


extend(&mut wave, &wave); 
assert_eq!(wave, vec![0.0, 
0.0， 


乍 一 看 这 样 没 问 题 。 但 别 筷 了， 在 给 向 量 追 加 元 素 时 ， 如 有 果 甚 缓冲 区 满 了 ， 就 必须 分 配 一 
块 更 大 的 空间 。 假 设 wave 开始 时 的 空间 能 容纳 4 个 元 素 ， 因 此 在 extend 想 添加 第 五 个 时 
必须 分 配 更 大 的 缓冲 区 。 此 时 的 内 存 如 图 5-8 所 示 。 
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图 5-8: 由 于 向 量 重 分 配 空间 导致 切片 变 成 悬空 指针 


这 个 extend 函数 的 vec 参数 借用 了 (调用 者 拥有 的 ) wave， 而 wave 给 自己 重新 分 配 了 一 
个 能 容纳 8 个 元 素 的 新 缓冲 区 。 但 stlice 参数 仍然 指向 原来 4 个 元 素 的 缓冲 区 ， 该 内 存 已 
被 清除 。 
这 种 问题 并 非 Rust 狼 有 : 在 很 多 语言 中 ， 修 改 集合 的 同时 还 指向 集合 很 容易 出 问题 。 在 
C++ 中 ，std::vector 规范 也 有 警告 “[ 向 量 缓 冲 区 的 ] 重新 分 配 会 导致 所 有 指向 该 序列 中 
元 素 的 引用 、 指 针 和 人 返 代 器 失效 "。 类 似 地 ， 针 对 修改 java.util.Hashtable 对 象 ，Java 也 
在 文档 中 指出 : 

在 创建 选 代 器 之 后 ， 除 非 通过 选 代 器 自身 的 remove 方法 对 Hashtable 进行 结构 性 

人 和 修改， 否则 选 代 器 会 拢 出 ConcurrentModificattonException。 


查找 这 种 bug 之 所 以 特别 难 ， 主 要 是 因为 其 并 不 经 常 发 生 。 测 试 的 时 候 ， 向 量 可 能 始终 都 
有 充足 的 空间 ， 缓 冲 区 不 会 重新 分 配 ， 因 而 问题 可 能 永远 不 会 暴露 出 来 。 
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不 过 ，Rust 会 在 编译 时 报告 extend 调用 有 问题 ; 


error[E0502]: cannot borrow “wave ”as immutable because it is also borrowed as mutable 
--> references_sharing_vs_mutation 2.rs:9:24 


9 extend(&mut wave, &wave); 


^^^^- mutable borrow ends here 


| immutabLe borrow occurs here 
mutable borrow occurs here 


Rust 的 意思 是 ， 可 以 借用 向 量 的 可 修改 引用 ， 也 可 以 借用 对 其 元 素 的 共享 引用 ， 但 这 两 个 
引用 的 生命 期 不 能 重合 。 在 我 们 的 代码 中 ， 这 两 个 引用 的 生命 期 都 包含 extend 调用 ， 因 此 
Rust 拒绝 编译 。 


归根 结 底 ， 以 上 错误 都 源 于 违背 了 Rust 关于 修改 和 共享 的 规则 。 


共享 访问 是 只 读 访 问 。 共 享 引用 借用 的 值 是 只 读 的 。 在 共享 引用 的 整个 生命 期 内 ， 任 何 
事物 都 不 能 修改 其 引用 目标 ， 也 不 能 修改 其 引用 目标 可 触及 的 值 。 结 构 中 不 存在 指向 任 
何 目标 的 可 修改 引用 ， 所 有 者 是 只 读 的 …… 实 际 上 这 个 值 冻结 了 。 

可 修改 访问 是 排他 访问 。 可 修改 引用 借用 的 值 只 能 通过 该 引用 访问 。 在 可 修改 引用 的 整 
个 生命 期 内 ， 没 有 其 他 路 径 可 触及 其 引用 目标 ， 或 触及 其 引用 目标 可 触及 的 值 。 唯 一 能 
够 与 可 修改 引用 的 生命 期 重合 的 ， 就 是 从 该 可 修改 引用 自身 借用 的 引用 。 


Rust 报告 extend 例子 违反 了 第 二 条 规则 : 因为 已 经 向 wave 借用 了 一 个 可 修改 引用 ， 所 以 
该 引用 必须 是 可 触及 这 个 向 量 及 其 元 素 的 唯一 途径 。 而 对 切片 的 共享 引用 本 身 是 可 抵达 向 
量 元 素 的 另 一 条 路 径 ， 这 违反 了 第 二 条 规则 。 

不 过 ，Rust 也 可 以 认为 我 们 的 bug 违反 了 第 一 条 规则 : 因为 已 经 借用 了 对 wave 元 素 的 一 
个 共享 5 引用， 所 以 无 论 元 素 还 是 vec 本 身 都 是 只 读 的 。 此 时 就 不 能 再 向 一 个 只 读 的 值 借用 
可 修改 引用 了 。 

这 两 种 引用 以 不 同方 式 影响 我 们 沿 所 有 权 路 径 操作 目标 值 ， 以 及 操作 通过 目标 值 可 达 的 其 
他 值 ， 如 图 5-9 所 示 。 
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所 有 权 树 借用 共享 引用 借用 可 修改 引用 
变量 不 能 访问 




















上 的 值 
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只 能 通过 这 个 引用 访问 














图 5-9: 借用 引用 会 影响 我 们 操作 同一 个 所 有 权 树 中 的 其 他 值 
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注意 在 这 两 种 情 况 下 ， 抵 达 引 用 目标 的 所 有 权 路 和 8 期 而 改变 。 对 于 共 
享 借用 ， 这 条 路 径 是 只 读 的 ， 对 于 可 修改 借用 ， 这 条 路 径 完 全 不 通 。 因 此 程序 没有 任何 途 
径 做 使 引用 无 效 的 事 。 


这 些 原理 可 以 通过 下 面 的 简单 的 例子 来 说 明 : 


let mut x = 10; 









































let ri = &x; 
let r2 = &x; // 可 以 : 允许 多 次 共享 借用 
x += 10; // 错误 : 不 能 给 x 赋值 ， 因 为 它 已 经 被 借用 了 








let m = &mut x;  // 错误 : 不 能 借用 x 的 可 修改 引用 ， 因 为 它 已 经 
// 入 加 子 不 本 修改 引用 











Let mut y = 20; 

let m1 = &mut y; 

Let m2 = &mut y; // 错误 : 不 能 借 两 次 可 修改 引用 

let z=y; // 错误 : 不 能 用 y， 因 为 它 已 经 借 出 了 可 修改 引用 


从 共享 引用 借用 共享 引用 是 可 以 的 : 


let mut w = (107, 109); 





























Let r = &w; 
let ro = &r.0; // 可 以 : 共享 引用 可 以 再 借用 为 共享 引用 
Let m1 = &mut r.1;  // 错误 : 共享 引用 不 能 再 借用 为 可 修改 引用 















































从 可 修改 引用 再 借用 可 修改 引用 也 是 可 以 的 : 


Let mut v = (136, 139); 
let m = &mut v; 






























































let m0 = &mut m.0; // 可 以 : 可 修改 引用 可 以 再 借用 为 可 修改 引用 

*mg = 137; 

let rl = &m.1; // 可 以 : 可 修改 引用 可 以 再 借用 为 共享 引用 ， 
// 日 不 与 (可 修改 引用 ) m0 重 又 

V.1; // 错误 : 禁止 通过 其 他 路 径 访问 
































这 些 限 制 相 当 严 格 。 回 头 再 看 看 extend(&mut wave，&wave) 调用 ， 并 没有 简易 可 行 的 办 

法 修改 代码 以 实现 我 们 的 意图 。 而 且 Rust 会 在 任何 地 方 应 用 这 些 规则 ， 比 如 我 们 借用 了 

HashMap 中 一 个 键 的 共享 引用 ， 直到 共享 引用 的 生命 期 结束 ， 才能 再 借用 对 这 个 HashMap 的 
可 修改 引用 。 


不 过 有 一 个 很 正当 的 理由 : 设计 出 一 种 集合 ， 让 它 支 持 无 限制 、 同 时 迭代 和 修改 还 是 很 困难 
的 ， 经 常会 因此 排除 更 简单 、 有 效 的 实现 。Java 的 Hashtable 和 C++ 的 vector 没有 自 找 麻 
烦 ， 当 然 Python 的 字典 、JavaScript 的 对 象 也 没有 对 这 种 存 取 行为 给 出 明确 定义 。JavaScript 
对 其 他 集合 类 型 有 明确 定义 ， 但 实现 会 比较 烦琐 。C++ 的 std: :map 承诺 插入 新 元 素 不 会 
影响 指向 映射 中 其 他 元 素 的 指针 ， 但 因为 有 了 这 个 承诺 ， 其 标准 库 排 除了 类 似 Rust 的 
BTreeMap 这 样 缓存 效率 更 高 的 设计 (Rust 的 BTreeMap 在 树 的 每 个 节点 都 保存 多 个 元 素 ) 。 


下 面 再 看 看 上 述 规则 可 以 捕获 的 另 一 种 bug 的 例子 。 下 面 的 C++ 代码 用 于 管理 一 个 文件 描 
述 符 。 为 简单 起 见 ， 这 里 只 给 出 一 个 构造 器 和 一 个 复制 赋值 操作 符 ， 省 略 错误 处 理 : 


struct File { 
int descriptor; 

















齐 













































































File(int d) : descriptor(d) { } 
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FiLe& operator=(const File &rhs) { 
close(descriptor); 
descriptor = dup(rhs.descriptor); 
return *this; 
} 
}; 


赋值 操作 符 相 当 简 单 ， 但 在 下 面 这 种 情况 下 会 失败 : 


File f(open("foo.txt", ...)); 





f = f; 
如 果 把 Fite 赋值 给 它 自己 ，rhs 和 *thts 就 是 同一 个 对 象 ，operator= 恰好 会 在 给 dup 传递 
描述 符 之 前 关闭 它 。 换 名 话说 ， 我 们 销毁 了 本 来 想 复制 的 资源 。 
在 Rust 中 ， 实 现 类 似 功能 的 代码 如 下 : 

struct File { 


descriptor: i32 
} 


fn new_file(d: i32) -> File { 
File { descriptor: d } 








fn clone from(this: &mut File, rhs: &File) { 
close(this.descriptor); 
this.descriptor = dup(rhs.descriptor); 


} 
(这 不 是 Rust 的 习惯 写法 。 第 9 章 会 讨论 为 Rust 类 型 提供 自己 的 构造 器 函数 和 方法 的 更 好 
方法 。 前 面 的 代码 只 是 很 适合 作为 示例 而 已 。) 
如 果 再 把 使 用 File 的 Rust 代码 写 出 来 ， 应 该 是 : 


Let mut f = new_ file(open("foo.txt", ...)); 





clone_from(&mut f, &f); 


当然 ，Rust 会 直接 拒绝 编译 它 : 


error[E0502]: cannot borrow `f`” as immutable because it is also 
borrowed as mutable 

--> references_self_assignment.rs:18:25 

| 

18 | CLone_from(&mut f, &f); 
| - 人 ^- mutable borrow ends here 
| | 
| | immutable borrow occurs here 
| mutable borrow occurs here 














这 个 错误 似曾相识 。 原 来 两 个 经 典 的 C++ bug (无 法 处 理 自 赋值 和 使 用 失效 的 迭代 器 ) 背 
后 是 同一 类 bug ! 这 两 种 情况 下 ， 代 码 都 会 假定 自己 在 修改 一 个 值 的 时 候 参 照 的 是 另 一 个 
值 ， 而 实际 上 它们 是 同一 个 值 。 如 果 你 在 使 用 C/C++ 的 memcpy 或 strcpy 时 曾 意外 让 它们 
的 源 和 目标 重合 ， 那 你 就 碰 到 了 这 种 bug 的 第 三 种 表现 形式 。Rust 通过 将 可 修改 存 取 限制 
为 排他 操作 ， 帮 有 我 们 避免 了 一 大 类 日 常 错误 。 











| 全 和 
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在 编写 并 发 代码 时 ， 共 享 和 可 修改 引用 不 相 温 合 的 价值 会 体现 得 淋 沈 尽 臻 。 只 有 某 个 值 在 
线程 间 既 可 修改 又 共享 了 时， 数据 争 用 才 会 发 生 ， 而 这 恰恰 是 Rust 的 引用 规则 所 致力 消除 
的 。 不 涉及 unsafe 代码 的 并 发 Rust 程序 ， 从 根基 上 就 不 会 存在 数据 争 用 。 第 19 章 在 讨论 
并 发 编程 时 会 深入 讨论 这 一 点 。 不 过 简单 概括 一 下 就 是 ， 用 Rust 编写 并 发 程序 比 用 大 多 数 
其 他 语言 更 容易 。 


























Rust 的 共享 引用 与 C 的 常量 指针 


Rust 共享 引用 给 人 的 第 一 印象 是 它 非常 像 C 和 C++ 的 常量 指针 。 然 而 ，Rust 共享 引 
用 的 规则 要 严格 得 多 。 比 如 ， 对 于 如 下 C 代码 : 

int x = 42; // 整数 变量 ， 不 是 常量 

const int *p = &x; // 指向 整数 常量 的 指针 (常量 指针 ) 

assert(*p == 42); 

Xx++; // 直接 修改 变量 


assert(*p == 43); //“ 不 变 ” 目 标的 值 也 变 了 


p 是 一 个 const int * 意味 着 不 能 通过 p 来 修改 它 引用 的 值 : (*p)++ 是 不 行 的 。 不 过 ， 
通过 Xx 也 可 以 直接 访问 到 同一 个 值 ，x 又 不 是 常量 ， 直 接 修 改 它 的 值 就 好 了 。C 家 族 
的 const 关键 字 有 其 用 途 ， 但 常量 不 尽 然 。 


在 Rust 中 ， 共 享 引 用 禁止 对 引用 的 值 进行 任何 修改 ， 直 到 其 生命 期 结束 : 














Let mut x = 42; // 1L32 变 量 ， 不 是 常量 

Let p = &x; // 对 fi32 值 的 共享 引用 

assert_eq!(*p, 42); 

x += 1; // 错误 : 因为 被 借用 了 ， 所 以 不 能 给 x 赋值 








assert_eq!(*p, 42); // 去 掉 赋 值 ， 这 个 断言 为 true 
为 保证 值 不 变 ， 需 要 跟踪 抵达 该 值 的 所 有 路 径 ， 确 保 要 么 不 允许 修改 ， 要 么 根本 就 到 
不 了 该 值 。C 和 C++ 编译 器 在 检查 这 方面 时 对 指针 过 于 宽松 。Rust 的 引用 则 始终 与 特 
定 生命 期 贴 合 ， 因 而 编译 时 检查 是 可 行 的 。 


5.4 征服 对 象 之 海 


自 20 世纪 90 年 代 自 动 内 存 管理 兴起 之 后 ， 所 有 程序 默认 的 架构 就 是 对 象 之 海 ， 如 图 5-10 所 示 。 


























5-10， 对 象 之 海 
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如 果 语 言 有 垃圾 收集 ， 而 且 没 经 过 设计 就 开始 编写 程序 ， 就 是 这 个 样子 。 一 直 以 来 ， 我 们 
构建 的 系统 都 是 如 此 。 

这 样 的 架构 有 很 多 图 中 没有 显示 的 优点 。 比 如 ， 可 以 快速 启动 一 个 项 目 ， 方便 验证 各 种 想 
法 ， 等 等 。 但 随 着 时 间 推 移 ， 儿 年 之 后 ， 你 会 毫 不 费力 地 发 现 这 个 项 目 必 须 完 全 重 写 了 
(暗合 了 AC/DC 的 “ 通 往 地 狱 的 快速 路 ”) 。 


当然 ， 它 也 有 缺点 。 像 这 样 对 象 之 间 可 以 无 限 地 相互 依赖 ， 程 序 会 难于 测试 、 演 进 ， 更 不 
要 说 组 件 隔 离 了 。 


Rust 特别 迷人 的 一 个 地 方 就 在 于 ， 其 所 有 权 模 型 给 这 条 “ 通 往 地 狱 的 快速 路 ”设置 了 减速 
带 。 在 Rust 中 构造 一 个 循环 引用 (两 个 值 互相 包 含 对 对 方 的 引用 ) 颇 费 周折 。 你 得 使 用 一 
种 智能 指针 ， 比 如 Rc， 还 要 用 到 内 部 修改 能 力 (目前 还 没 讲 到 这 一 块 )。Rust 更 喜欢 指针 、 
所 有 权 和 数据 流 单 向 通过 整个 系统 ， 如 图 5-11 所 示 。 












































图 5-11: 值 的 树 


之 所 以 在 这 个 当 口 指出 这 一 点 ， 是 因为 看 完 这 一 章 之 后 ， 大 家 很 容易 想 打破 约束 去 创造 一 
个 “结构 体 之 海 ”， 用 Rc 智能 指针 把 它们 连接 起 来 ， 最 终 复 现 自己 熟悉 的 各 种 面向 对 象 反 
模式 。 你 不 会 马上 得 运 ，Rust 的 所 有 权 模 型 总 会 给 你 制造 一 些 麻 烦 。 解 决 之 道 是 做 一 些 事 
前 设计 ， 构 建 更 好 的 程序 。 

Rust 所 做 的 一 切 ， 都 是 为 了 把 理解 程序 的 痛苦 从 未 来 拉 回 到 现在 。 不 可 思议 的 是 ， 其 效果 
很 好 : Rust 不 仅 可 以 强迫 你 理解 为 什么 自己 的 程序 是 线程 安全 的 ， 甚 至 还 会 要 求 你 在 更 高 
的 层面 上 进行 一 些 架 构 设 计 。 
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表达 式 





Lisp 程序 员 知 道 所 有 东西 的 值 ， 却 不 知道 那些 东西 的 计算 成 本 。 

Alan Perlis， 警 铅 #55 

本 章 将 介绍 Rust 的 表达 式 ， 它 也 是 Rust 国 数 体 的 主角 。 有 些 概念 ， 比 如 闭 包 、 友 代 器 ， 
都 太 这 奥 了 ， 稍 后 本 书 会 分 别 用 一 章 去 讨论 。 眼 下， 我 们 尽量 用 较 少 的 篇 幅 来 多 讲 一 些 
语法 。 


N > 五 一 一 
6.1 表达 式 语言 
Rust 虽然 看 起 来 和 C 家 族 的 语言 很 像 ， 但 这 只 是 它 的 一 个 策略 。 在 C 中 ， 表 达 式 和 语句 
有 着 鲜明 的 区 别 ， 这 是 表达 式 : 
5* (fahr-32) / 9 
而 这 是 语句 : 
for (; begin != end; ++begin) { 


if (*begin == target) 
break; 





} 
表达 式 有 值 ， 语 句 却 没 有 。 


Rust 是 所 谓 的 表达 式 语言 。 这 意味 着 它 遵循 一 种 比较 早期 的 传统 ， 可 以 追溯 到 Lisp， 当 时 
表达 式 包 打 天 下 。 


在 C 中 ，if 和 switch 是 语句 。 它 们 不 产生 值 ， 也 不 能 用 在 表达 式 中 间 。 而 在 Rust 中 ，if 
和 match 可 以 产生 值 。 第 2 章 已 经 展示 了 产生 数值 的 match 表达 式 : 
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pixels[r * bounds.0 + c] = 
match escapes(Complex { re: point.0, im: point.1 }, 255) { 
None => 0， 
Some(count) => 255 - count as u8 


3 
Rust 的 if 表达 式 可 以 用 来 初始 化 变量 : 


let status = 
if cpu.temperature <= MAX_TEMP { 
HttpStatus: :Ok 
} elsef 
HttpStatus::ServerError // 服务 器 错误 
}; 


Rust 的 match 表达 式 可 以 作为 参数 传 给 函数 或 宏 : 


println!("Inside the vat，you see {}.", 
match vat.contents { 
Some(brain) => brain.desc(), 
None => "nothing of interest" 


}); 


这 也 解释 了 为 什么 Rust 没有 C 的 三 元 操作 符 (expr1 ? expr2 : expr3)。 在 C 中 ， 三 元 操 
作 符 是 对 if 语句 在 表达 式 层面 的 一 个 快捷 等 价 物 。 但 在 Rust 中 ， 它 反而 显得 多 余 ， 因 为 
if 表达 式 两 种 情形 都 可 以 处 理 。 


C 中 的 大 多 数控 制 流 工具 是 语句 。 而 在 Rust 中 ， 它 们 全 是 表达 式 。 


6.2 块 与 分 号 


代码 块 ， 同 样 也 是 表达 式 。 块 产生 值 ， 其 可 以 用 于 任何 需要 值 的 地 方 : 


Let display_name = match post.author() { 
Some(author) => author .name(), 
None => { 
Let network_info = post.get_ network_metadata()?; 
let ip = network_info.client _address(); 
ip.to_string() 






































} 
}; 

Some(author) => 之 后 的 代码 是 一 个 简单 的 表达 式 author.name()。 而 None => 之 后 的 代 
码 是 一 个 块 表达 式 。 在 Rust 中 它们 没有 区 别 。 这 里 块 的 值 就 是 最 后 一 个 表达 式 ip.to_ 
string() 的 值 。 

注意 ， 那 个 表达 式 末 尾 没 有 分 号 。 大 多 数 Rust 代码 末尾 不 是 分 号 就 是 花 括 号 ， 就 跟 C 或 
Java 一 样 。 而 如 果 一 个 块 看 起 来 像 C 代码 ,分 号 出 现在 了 熟悉 的 位 置 ， 那 么 它 也 会 像 C 的 
块 一 样 运行 ， 其 值 将 为 ()。 正 如 第 2 章 提 到 的 ， 在 块 的 最 后 一 行 省 略 分 号 ， 就 会 让 这 个 块 
产生 一 个 值 ， 即 最 后 一 个 表达 式 的 值 。 

在 革 些 语言 ， 特 别 是 JavaScript 中 ,分 号 并 不 是 强制 要 写 的 ， 不 写 的 话语 言 会 帮 你 填 上 ， 











这 是 JavaScript 中 的 一 点 小 便利 。 但 这 里 不 一 样 。 在 Rust 中 ， 分 号 是 有 意义 的 。 


Let msg={ 
// Let 声 明 : 分 号 是 必需 的 
Let dandelion_control = puffball.open(); 





// 表达 式 + 分 号 : 方法 调用 ， 返 回 值 被 请 除 


dandelion_control.release all_seeds(launch codes); 

















// 表达 式 不 带 分 号 : 方法 被 调用 ， 返回 值 保存 于 msg 中 


dandelion control.get_status() 








} 


块 的 一 个 精妙 特性 是 既 可 以 包含 声明 又 可 以 在 末尾 产生 值 。 任 何人 都 可 以 很 快 习以为常 。 
唯一 的 缺点 是 : 在 意外 漏 掉 分 号 时 ， 会 导致 一 个 奇怪 的 错误 消息 。 























if preferences .changed() { 
page.compute_size()  // 噢 ， 漏 掉 了 分 号 

















如 果 是 在 C 或 Java 程序 中 犯 这 个 错 ， 编 译 器 会 直接 告诉 你 漏 掉 了 分 号 。 而 Rust 会 说 : 


error[E0308]: mismatched types 
--> expressions missing_semicolon.rs:19:9 


19 page.compute_size() ”// 噢 ， 漏 掉 了 分 号 


| 
| 
| 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 expected (5 found tuple 
| 


note: expected type ‘(). 
found type ‘(uy32, uy32). 


Rust 假设 你 是 有 意 省 略 分 号 的 ， 它 不 会 萎 虑 这 可 能 只 是 个 打字 错误 。 结 果 是 一 个 让 人 糊涂 
的 错误 消息 。 以 后 只 要 看 到 expected type`()`， 记 着 先 看 看 是 不 是 漏 写 了 分 号 。 
空 语句 可 以 出 现在 块 中 。 空 语句 就 是 一 个 孤立 的 分 号 ， 只 有 它 自己 : 








Loop { 

work(); 

play(); 

， // <-- 空 语句 
} 





Rust 遵循 C 的 传统 ， 人 许 出 现 这 种 情况 。 空 语句 除了 传达 一 丝 淡淡 的 翌 发 外 什么 也 不 干 。 
这 里 提 到 它 也 只 是 出 于 圆满 的 考虑 。 

6.3 声明 

除了 表达 式 和 分 号 ， 块 还 可 以 包含 多 个 任意 声明 。 最 常见 的 是 用 于 声明 局 部 变量 的 Let 声明 : 


let name: type = expr; 


其 中 ， 类 型 和 初始 值 是 可 选 的 ， 分 号 是 必需 的 。 
































Let 声明 可 以 只 声明 变量 而 不 初始 化 它 。 然 后 再 通过 赋值 来 初始 化 变量 。 这 样 偶 尔 有 用 ， 
因为 有 时 候 需 要 在 某 种 控制 流 结构 中 间 初 始 化 变量 : 


let name; 

if user.has_nickname() { 
name = user.nickname(); 

} else { 
name = generate_unique_name(); 
User.register(&name); 

















} 
这 里 有 两 种 不 同 的 初始 化 局 部 变量 name 的 方式 ， 但 不 管 是 哪 种 方式 都 只 能 初始 化 一 次 ， 
此 name 不 需要 声明 为 mut。 
在 初始 化 之 前 使 用 变量 是 错误 的 〈 这 跟 值 被 转移 之 后 还 使 用 它 是 类 似 的 ，Rust 希望 我 们 只 
在 它们 存在 时 使 用 值 )。 
偶尔 ， 你 也 会 看 到 像 是 重新 声明 一 个 已 有 变量 的 代码 ， 比 如 : 


for line in file.lines() { 
let line = line?; 














} 
以 上 代码 等 价 于 : 
for line result in file.lines() { 
let Line = line result?; 


} 
这 个 let 声明 创建 了 一 个 新 的 、 不 同 的 变量 ， 类 型 也 不 一 样 。line_result 的 类 型 是 


Result<String，io::Error>。 而 第 二 个 变量 Line 是 一 个 String。 第 二 个 变量 跟 第 一 个 变量 
使 用 相同 的 名 字 是 合法 的 。 本 书 在 这 种 情况 下 只 使 用 _result 后 级 ， 因 此 所 有 变量 都 有 不 
同 的 名 字 。 

块 里 也 可 以 包含 特性 项 声明 。 所 谓 特 性 项 (item) 指 的 是 任何 可 以 在 程序 或 模块 的 全 局 中 
出 现 的 声明 ， 比 如 fn、struct 或 use。 


后 面 几 章 会 详细 讨论 特性 项 。 现 在 ，fn 已 经 是 个 很 不 错 的 例子 了 。 任 何 块 中 都 可 以 包含 fn: 


use std::io; 
use std::cmp::Ordering; 


























fn show files() -> io::Result<()> { 
Let mut v = vec![]; 


fn cmp_by_timestamp_then_name(a: &FileInfo, b: &FileInfo) -> Ordering { 
a.timestamp.cmp(&b.timestamp) // 首先 ， 比 较 时 间 惟 
.reverse() // 最 新 的 文件 排 在 前 面 
.then(a.path.cmp(&b.path)) // 比较 路 径 排除 





v.sort_by(cmp_by_timestamp_then_name); 
} 


在 块 中 声明 的 fn， 其 作用 域 是 整个 块 。 换 名 话说 ， 它 可 以 在 整个 块 内 被 使 用 。 但 嵌 套 的 fn 
不 能 访问 该 作用 域 中 的 局 部 变量 或 参数 。 比 如 ， 国 数 cmp_by_timestamp_then_name 不 能 直 
接 使 用 v。(Rust 也 有 闭 包 ， 闭 包 是 可 以 访问 封闭 它 的 作用 域 的 。 详 见 第 14 章 。) 


块 中 甚至 可 以 包含 一 个 完整 的 模块 。 这 似乎 有 点 过 了 : 真 的 需要 把 语言 的 每 一 块 都 嵌 套 在 其 
他 块 中 吗 ? 不 过 程序 员 (特别 是 使 用 宏 的 程序 员 ) 总 能 把 语言 提供 的 每 个 特性 都 派 上 用 场 。 


6.4 if 与 natch 
if 表达 式 的 形式 我 们 很 熟悉 : 


if condition1 { 
block1 

} else if condition2 { 
block2 

} else{ 
block_n 

} 


每 个 condition 都 必须 是 一 个 bool 型 的 表达 式 。 而 且 一 如 既往 ，Rust 不 会 隐 式 地 把 数值 或 
指针 转换 为 布尔 值 。 


与 C 不 同 ， 围绕 条 件 的 圆 括号 不 是 必需 的 。 事实 上 ，rustc 在 发 现 不 必要 的 圆 括号 时 会 给 
出 警告 。 但 花 括 号 是 必需 的 。 


else if 块 和 最 后 的 else 块 都 是 可 选 的 。 一 个 疫 有 else 块 的 计 表 达 式 ， 就 像 它 有 一 个 空 
的 else 块 一 样 。 


match 表达 式 有 点 类 似 C 的 switch 语句 ， 但 更 灵活 。 来 看 一 个 简单 的 例子 : 


match code { 
0 => println!("OK"), 
1 => println!("Wires Tangled"), 
2 => println!("User Asleep'"), 
_ => println!("Unrecognized Error {}", code) 


} 


这 也 是 switch 语句 可 以 胜任 的 。 实 际 上 ， 根 据 code 的 值 ，4 个 match 表达 式 的 分 支 中 只 有 
1 个 会 执行 。 通 配 模式 _ 匹配 任何 值 ， 对 应 default: 条 件 。 


编译 器 可 以 使 用 跳 转 表 (jump table) 来 优化 这 种 match 表达 式 ， 就 像 C++ 中 的 switch 语 
句 一 样 。 如 果 match 的 每 个 分 支 都 产生 一 个 常量 值 ， 那 么 也 可 以 应 用 同样 的 优化 。 此 时 ， 
编辑 器 会 构建 一 个 这 些 值 的 数组 ， 而 match 会 被 编译 为 对 数组 的 访问 。 除 了 边界 检查 ， 编 
译 后 的 代码 中 根本 没有 分 支 。 

功能 丰富 的 match 源 自 对 各 种 各 样 模式 的 支持 ， 这 些 模式 可 以 用 在 每 个 分 支 => 的 左 侧 。 上 
看 ， 每 个 模式 就 是 一 个 常量 整数 。 我 们 也 看 到 了 能 区 分 两 种 0ption 值 的 match 表达 式 : 









































match params.get("name") { 
Some(name) => println!("Hello, {}!", name), 
None => println!("Greetings, stranger.") 


} 
对 于 模式 所 能 做 的 事 ， 这 只 能 算是 管 中 帘 豹 。 模 式 可 以 匹配 的 值 多 种 多 样 : 可 以 解 包 
(unpack) 元 组 ， 可 以 匹配 结构 体 的 个 别 字 段 ， 可 以 追 索 引用 ， 可 以 借用 一 个 值 的 某 一 部 
分 ， 等 等 。Rust 的 模式 本 身 就 是 一 门 小 型 语言 。 第 10 章 会 专门 用 一 定 篇 幅 来 讨论 模式 。 
match 表达 式 的 通用 形式 如 下 : 


match value { 
pattern => expr, 














} 
如 果 expr 是 一 个 块 ， 则 后 面 的 逗号 可 以 去 掉 。 


Rust 会 依次 用 每 个 模式 去 匹配 vatue， 从 第 一 个 模式 开始 。 如 果 哪 个 模式 匹配 ， 就 对 相应 
的 expr 求 值 ， 而 这 个 match 表达 式 结 束 ， 后 面 的 模式 就 不 再 继续 检查 了 。 所 有 模式 中 必须 
至 少 有 一 个 匹配 。Rust 会 拒绝 不 能 涵盖 所 有 可 能 值 的 match 表达 式 : 


let score = match card.rank { 
































Jack => 10， 
Queen => 10， 
Ace => 11 


}; // 错误 : 模式 不 够 全 面 
if 表达 式 的 所 有 块 都 必须 产生 相同 类 型 的 值 : 


let suggested pet = 
if with wings { Pet::Buzzard } else { Pet::Hyena }; // 可 以 


Let favorite number = 
if user.is hobbit() { "eleventy-one"” } else { 9 }; // 错误 


let best_sports_team = 
if is_hockey_season() { "Predators”}; // 错误 


(最 后 一 个 例子 错误 ， 是 因为 7 月 份 不 是 曲棍球 比赛 季 ， 结 果 将 为 ()。) 
类 似 地 ，match 表达 式 的 所 有 分 支 也 都 必须 返回 相同 类 型 的 值 : 


let suggested_pet = 
match favorites.eLement { 
Fire => Pet::RedPanda ， 
ALr => Pet::Buffalo, 
Water => Pet::Orca, 
_ => None // 错误 :不 兼容 的 类 型 














} 


if Let 
if 还 有 一 种 形式 ， 就 是 if let 表达 式 .: 





if Let pattern = expr { 
block1 

} else{ 
block2 

} 


这 里 的 expr 要 么 匹配 pattern， 运 行 block1， 要 么 不 匹配 pattern， 运 行 block2。 有 时 候 ， 
这 


这 是 从 0ption 或 Result 中 取得 数据 的 一 种 便捷 方式 : 


if Let Some(cookie) = request.session cookie { 
return restore_session(cookie); 





. 


if let Err(err) = present _ cheesy_anti robot task() { 
log_robot _ attempt(err); 
politely_accuse user_of _being a_robot(); 

} else{ 
session.mark_as_human(); 


} 
并 不 是 说 这 里 必须 使 用 if Let， 因 为 match 也 完全 可 以 代替 if let。if let 表达 式 只 是 对 
只 有 一 个 模式 的 match 的 简写 : 


match expr { 
pattern => { block1 } 


_ =>{ block2 } 
和 
从 
6.5 ”循环 
有 4 种 循环 表达 式 : 
while condition { 
block 
} 
while let pattern = expr { 
block 
} 
loop { 
block 
} 


for pattern in collection { 
block 
} 


循环 在 Rust 中 是 表达 式 ， 但 它们 不 会 产生 有 用 的 值 。 循 环 的 值 是 ()。 
while 循环 的 行为 与 C 类 似 ， 除 了 condition 必须 是 bool 类 型 。 
while let 循环 跟 if let 类 似 。 在 每 次 循环 迭代 开始 时 ，expr 的 值 要 么 匹配 给 定 的 
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pattern， 运 行 后 面 的 块 ， 要 么 不 匹配 给 定 的 pattern， 退 出 循环 。 


Loop 用 于 编写 无 穷 循 环 。 它 后 面 的 bLock 会 永远 重复 执行 〈 或 直至 遇 到 一 个 break 或 
return， 或 者 线程 诈 异 ) 。 

for 循环 对 collection 表达 式 求 值 ， 然 后 该 集合 中 的 每 个 值 分 别 对 blLock 求 值 。 支 持 的 集 
合 类 型 有 很 多 。 以 下 是 标准 的 C 循环 : 


for (int i = 0; i < 20; i++) { 
printf("%d\n", i); 

















Rust 中 则 是 这 样 写 的 : 


for i in 0..20 { 
println!("{}", i); 


跟 C 中 一 样 ， 最 后 一 个 打印 的 数值 是 19。 


.… 操作 符 产生 一 个 范围 (range)， 即 一 个 拥有 两 个 字段 (start 和 end) 的 简单 结构 体 。 
0..20 跟 std::ops::Range { start: 0，end: 20 } 是 一 样 的 。Range 可 用 于 循环 是 因为 它 是 
一 个 可 迭代 类 型 ， 其 实现 了 第 15 章 讨 论 的 std: :iter::IntoIterator 特 型 。 标 准 的 集合 
比如 数组 和 切片 ， 都 是 可 烛 代 的 。 


与 Rust 的 转移 语义 一 致 ，for 循环 每 迭代 一 个 值 就 会 用 掉 一 个 值 : 


Let strings: Vec<String> = error_messages(); 
for s in strings { // 每 个 String 都 在 这 里 转移 到 s…… 


println!("{}", s); 
} Wh ss 并 在 这 里 被 清除 
println!("{} error(s)",strings.len()); // 错误 : 使 用 被 转移 的 值 
ee 简单 的 补救 方式 是 从 代 对 集合 的 引用 。 这 样 ， 循 环 变 量 就 是 对 集合 中 


for rs in &strings { 
println!("String {:?} is at address {:p}.", *rs, rs); 









































} 
这 里 &strings 的 类 型 是 &vec<String>，Frs 的 类 型 是 &String。 
友 代 mut 引用 ， 则 循环 变量 拿 到 的 也 是 mut 引用 : 


for rs in &mut strings { // rs 的 类 型 是 &mut String 
rs.push('\n'); // 给 每 个 字符 串 添加 一 个 换行 符 
} 


第 15 章 还 会 更 详尽 地 介绍 for 循环 ， 并 展示 使 用 运 代 器 的 很 多 其 他 方式 。 


break 表达 式 用 于 退出 闭合 循环 。( 在 Rust 中 ，break 只 能 用 在 循环 中 。 因 为 不 像 switch 
语句 ，match 表达 式 用 不 着 它 。) 


continue 表达 式 跳 到 循环 的 下 一 次 迭代 : 














// 读 取 数 据 ， 每 次 一 行 
for Line in input_lines { 
let trimmed = trim_comments_and_whitespace(Line); 
if trimmed.is empty() { 
// 跳 到 循环 项 部， 取得 输入 的 下 一 行 
continue; 


} 
i 


在 for 循环 中 ，continue 会 前 进 到 集合 中 的 下 一 个 值 。 如 果 已 经 没有 值 了 ， 则 退出 循环 。 
类 似 地 ， 在 white 循环 中 ，continue 会 再 次 检查 循环 条 件 ， 如 果 为 假 ， 则 退出 循环 。 


循环 可 以 加 上 生命 期 标签 。 在 下 面 的 例子 中 ，'search: 是 外 部 for 循环 的 标签 。 因 此 
break 'search 要 退出 的 不 是 内 部 循环 ， 而 是 外 部 循环 。 


"search : 
for room in apartment { 
for spot in room.hiding_spots() { 
if spot.contains(keys) { 
println!("Your keys are {} in the {}.", spot, room); 
break 'search; 








3 
标签 也 可 以 跟 continue 一 起 用 。 


6.6 ” return 表达 式 
return 表达 式 退 出 当前 函数 ， 向 调用 者 返回 一 个 值 。 
无 值 return 表达 式 是 return() 的 简写 : 
fn f() { 7/ 省 略 返回 类 型 ， 默认 为 () 
eearny 1/ 省 几 返回 值 ， 际 认为 


与 break 表达 式 类 似 ，return 可 以 放弃 正在 进行 的 工作 。 比 如 ， 第 2 章 曾 使 用 ? 操作 符 检 
查 可 能 失败 的 函数 调用 : 


Let output = File::create(filename)?; 
并 解释 说 这 是 对 一 个 match 表达 式 的 简写 : 


Let output = match File::create(filename) { 
Ok(f) => f, 
Err(err) => return Err(err) 








}; 


这 里 代码 先 调用 File::create(filename)， 如 果 返 回 0Ok(f)， 那 么 整个 match 表达 式 求 值 为 
f， 因 此 f 会 保存 在 output 中 。 然 后 继续 执行 match 表达 式 后 面 的 下 一 行 代码 。 





否则 ， 就 会 匹配 Err(err) 并 命中 return 表达 式 。 这 时 候 ， 对 match 表达 式 求 值 以 确定 变 
量 output 的 值 已 经 不 重要 了 ， 因 为 函数 调用 出 错 会 终止 后 面 的 所 有 工作 ， 并 进出 闭合 函 
数 ， 返 回 从 File::create() 调用 获得 的 错误 。 


7.2.4 节 在 介绍 传播 错误 时 ， 会 更 全 面 地 介绍 ? 操作 符 。 


6.7 为 什么 Rust 有 循环 

Rust 编译 器 有 几 个 部 分 会 通过 你 的 程序 分 析 控 制 流 。 

。 Rust 检查 贯穿 国 数 的 每 条 路 径 ， 确 保 返 回 值 为 正确 类 型 。 为 了 正确 地 完成 这 个 检查 ， 它 
需要 知道 是 否 可 能 到 达 函 数 末 尾 。 

。 Rust 检 查 局 部 变量 永远 不 会 在 未 始终 化 时 被 使 用 。 因 此 必须 检查 贯穿 国 数 的 每 一 条 路 径 ， 
以 确保 不 会 抵达 一 个 变量 尚未 经 过 初始 化 就 被 使 用 的 地 方 。 

。 Rust 会 对 无 法 抵达 的 代码 给 出 警告 。 如 果 贯 穿 函 数 的 路 径 没有 一 条 能 抵达 ， 那 么 相应 的 
代码 就 是 无 法 抵达 的 。 

以 上 这 些 称 为 流 敏 感 (flow-sensitive) 分 析 。 这 没什么 新 鲜 的 ，Java 很 多 年 前 就 有 “明确 

赋值 ”(definite assigment) 分 析 了 ，Rust 的 也 类 似 。 


在 强制 执行 这 些 规 则 时 ， 语 言 必须 在 简单 (simplicity) 和 机 巧 (cleverness) 之 间 取 得 平 
衡 。 前 者 可 以 让 程序 员 有 时 候 更 容易 明白 编译 器 在 说 什么 ， 后 者 有 助 于 减少 误 报 及 避免 拒 
绝 实际 上 非常 安全 的 程序 。Rust 追求 简单 ， 其 流 敏感 分 析 压 根 不 会 检查 循环 条 件 ， 而 只 是 
假设 程序 中 的 任何 条 件 不 是 true 就 是 false。 


于 是 ，Rust 可 能 会 拒绝 某 些 安全 的 程序 : 


fn wait for_process(process: &mut Process) -> i32 { 
while true { 
if process.wait() { 
return process.exit code(); 























} 
} 
} // 错误 : 并 非 所 有 控制 路 径 都 返回 值 
这 个 错误 是 假 的 。 实 际 上 ， 没 有 返回 值 不 可 能 抵达 函数 的 末尾 。 
Loop 表达 式 就 是 作为 解决 这 个 问题 的 “心口 如 一 ”的 方案 给 出 的 。 


Rust 的 类 型 系统 也 受 控制 流 的 影响 。 前 面 说 过 ，if 表达 式 的 所 有 分 支 必须 是 相同 的 类 
型 。 如 果 把 这 个 规则 强加 给 以 break 或 return 表达 式 结尾 的 块 、 无 穷 loop、 对 panic!() 
或 std::process::exit() 的 调用 ， 则 是 不 明智 的 。 这 些 表 达 式 共有 的 特点 是 它们 都 不 以 
惯常 的 方式 结束 ， 不 返回 值 。break 或 return 会 突然 退出 当前 块 ， 无 穷 循环 永远 也 不 会 


























因此 在 Rust 中 ， 这 些 表达 式 没有 常规 的 类 型 。 不 正常 结束 的 表达 式 通常 被 指定 为 特殊 类 
型 !， 它 们 不 受 其 他 类 型 需要 遵从 的 规则 的 约束 。 在 std: :process: :exit() 的 函数 签名 中 
可 以 看 到 !: 








fn exit(code: 132) -> ! 
! 的 意思 是 exit() 永远 也 不 会 返回 ， 它 是 一 个 发 散 函 数 (divergent function ) 。 
使 用 同样 的 语法 也 可 以 自 定义 发 散 函 数 ， 在 某 些 情况 下 这 是 自然 而 然 的 事 : 


fn serve_forever(socket: ServerSocket, handler: ServerHandler) -> !{ 
socket. listen(); 
Loop { 
let s = socket.accept(); 
handler .handle(s); 











} 
} 


当然 ， 如 果 这 个 函数 可 以 正常 返回 ， 那 么 Rust 会 认为 它 是 一 个 错误 。 
本 章 关 于 控制 流 的 部 分 至 此 就 告 一 段落 了 。 接 下 来 介绍 Rust 函数 、 方 法 和 操作 符 。 


6.8 函数 与 方法 调用 
跟 在 许多 其 他 语言 中 一 样 ， 调 用 函数 与 方法 的 语法 在 Rust 中 是 一 样 的 : 
Let x = gcd(1302，462); // 函数 调用 





Let room = player.location(); // 方法 调用 
这 里 第 二 个 例子 中 ，player 是 编造 的 类 型 Player 的 变量 ， 这 个 类 型 有 一 个 编造 的 . location() 
方法 。( 第 9 章 在 讨论 用 户 定义 类 型 时 会 介绍 如 何 定义 自己 的 方法 。) 
Rust 通常 会 将 引用 与 它们 指 问 的 值 截然 分 开 。 如 果 你 给 期 望 132 的 函数 传 入 一 个 &i32， 那 
就 是 个 类 型 错误 。 但 . 操作 符 会 让 这 个 规则 放宽 松 一 些 。 在 方法 调用 player .location() 
中 ，player 可 以 是 一 个 Player、 一 个 对 类 型 &Player 的 引用 ， 也 可 以 是 一 个 类 型 
Box<Player> 或 Rc<Player> 的 智能 指针 。.tLocation() 方法 可 以 接收 pLayer 的 值 或 引用 。 
相同 的 .Location() 语法 适用 于 上 述 所 有 情形 ， 因 为 Rust 的 . 操作 符 会 根据 需求 自动 解 引 
用 player 或 借用 一 个 对 它 的 引用 。 
第 三 种 语法 用 于 调用 静态 方法 ， 比 如 Vec: :new(): 
Let mut numbers = Vec: :new(); // 静态 方法 调用 
静态 方法 与 非 静 态 方法 的 区 别 与 面向 对 象 语言 中 一 样 : 静态 方法 通过 类 型 (如 Vec: :new() ) 
调用 ， 而 非 静态 方法 通过 值 (如 my_vec.len()) 调用 。 
自然 ， 方 法 可 以 链 式 调用 : 
Iron: :new(router ) .http("LocaLhost:3000") .unwrap(); 
Rust 语法 有 一 个 怪癖 ， 即 通 稼 用 于 函数 调用 或 方法 调用 的 语法 不 能 用 于 泛 型 Vec<T>: 


return Vec<i32>: :With_capacity(1000); // 错误 : 要 进行 链 式 比较 的 



































Let ramp = (0 .. nNn).collect<Vec<i32>>(); // 同样 的 错误 








问题 在 于 表达 式 < 是 一 个 小 于 操作 符 。Rust 编译 器 对 这 种 情况 会 建议 使 用 ::<T> 而 不 是 


<T>: 





return Vec::<i32>: :with_capactty(1609); // 可 以 : 使 用 : :< 

let ramp = (0 .. n).collect::<Vec<i32>>(); // 可 以 : 使 用 : :< 
这 样 问题 就 解决 了 。Rust 社区 亲切 地 称 符号 ::<...> 为 极速 鱼 (turbofish)。 
此 外 ， 也 可 以 省 略 类 型 参数 ， 让 Rust 自己 推断 : 


return Vec::with_capacity(10); // 可 以 : 只 要 fn 返回 类 型 是 Vec<i32> 





Let ramp: Vec<i32> = (0 .. n).coLLect(); // 可 以 : 变量 的 类 型 已 给 定 


只 要 可 以 推断 出 来 ， 省 略 类 型 参数 是 推荐 的 做 法 。 


= F 几 万 一 
6.9 ”字段 与 元 素 
结构 体 的 字段 使 用 类 似 的 语法 存 取 。 元 组 的 元 素 除 了 使 用 数值 而 非 名 字 访 问 之 外 也 一 样 : 


game.black_pawns // 结构 体 字段 
coords.1 // 元 组 元 素 


如 果 . 左 侧 的 值 是 一 个 引用 或 智能 指针 类 型 ， 它 就 会 跟 方 法 调用 一 样 自动 解 引 用 。 
方 括号 用 于 访问 数组 、 切 片 或 向 量 中 的 元 素 : 
pieces[i] // 数组 元 素 
方 括号 左 侧 的 值 会 自动 解 引 用 。 
类 似 下 面 这 3 个 这 样 的 表达 式 叫 作 左 值 (lvalue) ， 因 为 它们 会 出 现在 赋值 操作 的 左 侧 : 
game.black_pawns = 0x00ff0000_00000000_u64; 


coords.1 = 0; 
pieces[2] = Some(Piece::new(Black, Knight, coords)); 








LI 

















当然 ，game 、coords 和 pieces 必须 声明 为 mut 变量 才 行 。 
从 数组 或 向 量 中 提取 切片 很 直观 : 
let second half = &game moves[midpoint .. end]; 


这 里 game_moves 可 以 是 数组 、 切 片 或 向 量 。 结 果 则 是 一 个 借用 的 切片 ， 长 度 为 end - 
midpoint。game_moves 在 second_half 的 生命 期 中 是 被 借用 的 。 

范围 操作 符 .. 允许 省 略 两 侧 的 操作 数 。 根 据 操作 数 的 个 数 ， 有 可 能 产生 4 种 不 同类 型 的 
对 象 : 








要 // RangeFull 

acs // RangeFrom { start: a } 
,路 // RangeTo { end: b } 

a..b // Range { start: a, end: b } 








Rust 范围 是 半 开 口 (half-open) 的 : 包含 起 始 值 (如 果 有 的 话 ) ， 不 包含 结尾 值 。 范 围 6 .4 
包含 数值 0、1、2 和 3。 

只 有 包含 起 始 值 的 范围 才 是 可 迭代 的 ， 因 为 循环 必须 从 某 个 地 方 开始 。 但 在 数组 切片 中 ， 
以 上 4 种 形式 都 是 有 用 的 。 如 果 省 略 范围 的 起 始 和 结尾 ， 则 默认 以 数据 的 起 始 和 结尾 来 
切割 。 


因此 ， 下 面 就 是 一 个 采用 经 典 分 治 法 实现 快速 排序 的 例子 〈 部 分 代码 ) : 


fn quicksort<T: Ord>(slice: &mut [T]) { 
if slice.len() <= 1{ 
return; // 没什么 要 排序 





























} 
// 将 切片 分 成 前 、 后 两 部 分 


Let pivot index = partition(slice); 


// 递归 对 sLice 的 前 半 部 分 进行 排序 


quicksort(&mut slice[.. pivot index]); 








// 递归 对 sLice 的 后 半 部 分 进行 排序 
quicksort(&mut slice[pivot index + 1 ..]); 


} 


6.10 引用 操作 符 


取 地 址 操作 符 & 和 &mut 在 第 5 章 介绍 过 。 

一 元 操作 符 * 用 于 访问 引用 指向 的 值 。 如 前 所 述 ， 在 使 用 . 操作 符 时 Rust 会 自动 跟踪 引用 
去 访问 字段 或 方法 ， 因 此 * 只 在 需要 读 或 写 该 引用 指向 的 整个 值 时 才 是 必要 的 。 

比如 ， 有 时 候 返 代 器 会 产生 引用 ， 但 程序 需要 的 是 下 面 的 值 : 


Let padovan: Vec<u64> = Compute_padovan_sequence(n); 
for elem in &padovan { 
draw_triangle(turtle, *elem); 


} 


在 这 个 例子 中 ，elen 的 类 型 是 &u64， 因 此 *elen 就 是 u64。 


人 7 \ 品 寺 品 fe 
6.11 和 算术、 位、 比较 和 逻辑 操作 符 
Rust 的 二 元 操作 符 跟 许多 其 他 语言 中 的 一 样 。 为 节省 时 间 ， 假 设 读者 至 少 熟 悉 其 中 一 种 语 
言 ， 这 里 只 介绍 Rust 的 不 同 之 处 。 
Rust 有 常用 的 算术 操作 符 +、-、*、/ 和 %。 第 3 章 提 到 过 ， 调 试 构建 会 检查 出 整数 游 出 并 
导致 诈 异 。 标 准 库 为 未 检查 的 算术 计算 提供 了 类 似 a.wrapping_add(b) 这 样 的 方法 。 


即使 在 发 布 构建 中 ， 整 数 被 零 除 也 会 触发 诈 异 。 整 数 有 一 个 方法 a.checked_div(b)， 其 会 
返回 一 个 0ption (如 果 b 是 0 则 为 None)， 并 永远 不 会 导致 证 异 。 



























































一 元 - 将 数值 取 反 。 除 了 无 符号 整数 ， 所 有 数值 类 型 都 支持 它 。 没 有 一 元 + 操作 符 。 
println!("{}", -100); // -100 
println!("{}"，-190u32); // 错误 : 不 能 给 u32 类 型 应 用 一 元 - 
println!("{}", +100); // 错误 : 期 待 表达 式 ， 发 现 + 


与 C 类 似 ，a % b 计算 除法 的 余数 或 模 数 。 结 果 的 符号 与 左手 操作 数 相同 。 注 意 ，% 既 可 
以 用 于 浮 点 数 ， 也 可 以 用 于 整数 : 


Let x = 1234.567 % 10.0; ”// 约 等 于 4.567 


Rust 也 继承 了 C 的 按 位 整数 操作 符 &、|、^、<< 和 >>。 不 过 ， 对 于 按 位 非 ，Rust 使 用 ! 而 


不 是 ~: 


let hi: u8 = 0xe0; 
Let Lo = !hi; // Oxif 


这 意味 着 对 于 整数 n， 不 能 用 !n 表示 “n 是 0”。 为 此 ， 要 写成 n == 90。 


按 位 移动 对 于 有 符号 整数 始终 是 以 符号 位 填充 ， 对 于 无 符号 整数 则 始终 是 以 零 填 充 。 因 为 
Rust 有 无 符号 整数 ， 所 以 它 不 需要 Java 的 >>> (无 符号 右 移 ) 操作 符 。 


与 C 不 一 样 ，Rust 中 位 操作 的 优先 级 高 于 比较 操作 。 因 此 ，x & BIT != 9 的 意思 是 (x & BIT) 
!= 0， 通 常 这 都 是 我 们 想 要 的 。 这 比 在 C 中 的 含义 x & (BIT != 0) (用 于 测试 错位 ) 更 有 用 。 


Rust 的 比较 操作 符 是 =、!=、<、<=、> 和 >=。 被 比较 的 两 个 值 必须 具有 相同 的 类 型 。 
Rust 还 有 两 个 短路 逻辑 操作 符 && 和 11。 它 们 的 操作 数 必须 都 是 boot 类 型 。 


6.12 ”赋值 
赋值 操作 符 = 用 于 把 值 赋 给 mut 变量 以 及 它们 的 字段 或 元 素 。 但 赋值 在 Rust 中 不 像 其 他 语 
言 中 那么 常见 ， 因 为 变量 默认 是 不 可 修改 的 。 
第 4 章 提 到 过 ， 赋 值 会 转移 非 可 复制 类 型 的 值 ， 而 不 是 隐 式 地 复制 它们 。 
Rust 也 支持 复合 赋值 
total += item.price; 


这 相当 于 total = total + item.price;。 其 他 的 操作 符 也 支持 -=、*=， 等 等 。 完 整 的 清单 
参见 本 章 末 尾 的 表 6-1。 


与 C 不 一 样 ，Rust 不 支持 链 式 赋值 ， 即 不 能 通过 a = b = 3 把 值 3 同时 赋 给 a 和 b。 在 
Rust 中 需要 这 样 连续 赋值 的 情形 少 之 又 少 。 


Rust 没有 C 的 递增 操作 符 ++ 和 递减 操作 符 - -。 
6.13 ”类 型 转换 


在 Rust 中 ， 将 一 个 值 从 一 种 类 型 转换 为 另 一 种 类 型 通常 需要 显 式 转换 。 类 型 转换 使 用 as 
关键 字 : 
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let x = 17; // x 的 类 型 是 132 
Let index = x as usize; // 转换 为 usize 
以 下 是 儿 种 允许 的 类 型 转换 。 
。 数值 可 以 从 任何 内 置 的 数值 类 型 转换 为 任意 其 他 类 型 。 
整数 转换 为 整数 始终 是 意义 明确 的 。 转 换 为 更 窗 的 类 型 会 导致 截断 。 有 符号 整数 转换 为 
更 宽 的 类 型 会 以 符号 填充 ， 无 符号 整数 会 以 零 填 充 ， 等 等 。 简 言 之 ， 没 有 什么 意外 。 
不 过 ， 截 至 本 书 撰写 之 时 ， 把 大 浮 点 值 转换 为 太 小 而 无 法 表示 它 的 整数 类 型 会 导致 未 定 
义 行为 ， 这 即便 在 安全 的 Rust 代码 中 也 可 能 造成 程序 月 涡 。 这 是 编译 器 的 一 个 bug。 


bool、char 或 类 C 的 enun 类 型 的 值 , 可 以 转换 为 任何 整数 类 型 。( 第 10 章 将 讨论 枚 举 。) 


另 一 个 方向 的 转换 是 不 允许 的 ， 因 为 booL、char 和 enum 类 型 对 自己 的 值 都 有 限制 ， 
都 必须 强制 通过 运行 时 检查 。 比 如 ， 禁 止 将 u16 转换 为 char 是 因为 某 些 ui6 值 (如 
9xd860) 对 应 的 是 Unicode 代理 码 点 ， 因 此 转换 后 得 不 到 有 效 的 char 值 。 标 准 方法 
std: :char::from_u32() 会 执行 运行 时 检查 有 晶 返 回 0ption<char>。 不 过 ， 说 来 说 去 ， 这 
种 转换 实际 上 没有 太 大 必要 。 我 们 一 般 会 一 次 性 转换 整个 字符 串 或 流 ， 而 涉及 Unicode 
文本 的 算法 通常 也 不 简单 ， 最 好 还 是 通过 库 去 做 。 

有 一 个 例外 ， 就 是 u8 可 以 转换 为 char， 因 为 从 0 到 255 的 所 有 整数 都 是 适合 char 存储 
的 有 效 的 Unicode 码 点 。 


。 有 些 涉 及 不 安全 指针 类 型 的 转换 也 是 允许 的 。 参 见 21.7 节 。 

前 面 说 过 ， 转 换 通 常 需要 显 式 进 行 。 不 过 ， 有 些 涉 及 引用 类 型 的 转换 非常 简单 直接 ， 根 本 
不 需要 显 式 进行 。 比 如 ， 把 一 个 mut 引用 转换 为 非 mut 引用 。 

以 下 是 另外 一 些 比较 重要 的 自动 转换 。 

。 &String 类 型 的 值 会 自动 转换 为 &str 类 型 。 

。 8&Vec<i32> 类 型 的 值 会 自动 转换 为 &[i32]。 

。 &Box<Chessboard> 类 型 的 值 会 自动 转换 为 &Chessboard。 

这 些 转换 被 称 为 “ 解 引 用 强制 转换 ”(deref coercion) ， 因 为 它们 适应 于 实现 了 内 置 的 Deref 
特 型 的 类 型 。 解 引用 强制 转换 的 目的 是 让 Box 这 种 智能 指针 类 型 看 起 来 尽 可 能 像 它 后 面 的 
值 。 因 为 实现 了 Deref， 所 以 使 用 Box<Chessboard> 多 数 情况 下 跟 使 用 Chessboard 没什么 
区 别 。 

用 户 定义 类 型 也 可 以 实现 Deref 特 型 。 如 果 你 需要 编写 自己 的 智能 指针 类 型 ， 可 以 参考 
13.5 节 。 


6.14 闭 包 


Rust 有 闭 包 ， 即 类 似 函 数 的 轻 量 值 。 闭 包 通常 由 参数 列表 (在 两 条 竖 线 中 给 出 ) 和 表达 式 
组 成 。 


let is even = |x| x % 2 == 0; 

























































































Rust 推断 参数 类 型 和 返 
了 返 














回 类 型 ， 那 么 闭 包 体 必 须 是 一 个 块 ， 否 则 是 个 语法 错误 : 
let is_even = |x: u64| -> bool x % 2 == 0; // 错误 

let is even = |x: u64| -> booL { x %2 == 0 }; // 可 以 
调用 闭 包 与 调用 函数 的 语法 相同 : 


assert eq!(is even(14), true); 


回 类 型 。 当 然 也 可 以 明确 地 写 出 来 ， 就 跟 定 义 国 数 一 样 。 如 果 指 定 





闭 包 是 Rust 最 讨 人 喜欢 的 特性 之 一 ， 关 于 它 有 很 多 东西 可 以 讲 。 第 14 章 将 详细 讨论 。 


6.15 ”优先 级 与 关联 性 


表 6-1 总 结 了 Rust 表达 式 语法 。 操 作 符 按照 优先 级 从 高 到 低 的 顺序 给 H 





H。( 与 大 多 数 编 程 


语言 一 样 ，Rust 也 有 操作 符 优 先 级 ， 其 用 于 在 表达 式 中 包含 多 个 毗连 操作 符 时 确定 操作 的 


























顺序 。 比 如 , 在 Linit < 2 * broom.size + 1 中 ，. 操作 符 具 有 最 高 优先 级 ， 因 此 首先 会 
读 取 该 字段 的 值 。) 
表 6-1: Rust 表 达 式 小 结 
表达 式 类 型 示 例 相关 特 型 
数组 字面 量 [1，2 ,3] 
重复 的 数组 字面 量 [6; 56] 
元 组 (6, "crullers") 
分 组 (2 + 2) 
块 { f(); g() } 
控制 流 表达 式 if ok { f() } 
if ok {1} else{0} 
if let Some(x) = f() { x } else {0} 
match x { None => 0, _ => 1} 
for v in e { f(v); } std::iter::IntoIterator 
while ok { ok = f(); } 
while let Some(x) = it.next() { f(x); } 
Loop { next_event(); } 
break 
continue 
return 0 
宏 调 用 println!("ok") 
路 径 std::f64: :consts: :PI 
结构 体 字 面 量 Point {x: 0, y: 0} 
元 组 字段 存 取 pair.0 Deref 、DerefMut 
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( 续 
表达 式 类 型 示 例 相关 特 型 
结构 体 字段 存 取 point.x Deref 、 DerefMut 
方法 调用 point.translate(50, 50) Deref 、DerefMut 
函数 调用 stdin() Fn(Arg0, ...) -> T、 
FnMut(Arg0, ...) -> T、 
FnOonce(Arg0, ...) ->T 
索引 arr[9] Index、IndexMut 
Deref 、 DerefMut 
错误 检查 create_dir("tmp")? 
逻辑 / 按 位 非 !ok Not 
取 反 -num Neg 
解 引 用 #ptr Deref 、 DerefMut 
借用 &val 
类 型 转换 x as u32 
乘 n * 2 Mul 
除 n/2 Div 
取 余 ( 取 模 ) n% 2 Rem 
加 n+1 Add 
减 n-1 Sub 
左 移 n<<1 shl 
右 移 n >> 1 Shr 
按 位 与 n & 1 BitAnd 
按 位 异 或 证 六 本 BitXor 
按 位 或 n|1 Bitor 
小 于 证 : 专 汗 std::cmp::PartiaLOrd 
小 于 等 于 n <= 1 std: :cmp: :PartialOrd 
大 于 n>1 std: :cmp: :PartialOrd 
大 于 等 于 n >= 1 std: :cmp: :PartialOrd 
等 于 Wa 六 std: :cmp: :PartialEq 
不 等 于 Wi 入 std: :cmp: :PartialEq 
逻辑 与 x.ok && y.ok 
逻辑 或 x.ok || backup.ok 
范围 start .. stop 
赋值 X = val 
复合 赋值 x *= 1 MulAssign 
X /1 DivAssign 
x %= 1 RemAssign 
x+= 1 AddAssign 
X= 计生 SubAssign 
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表达 式 类 型 示 例 相关 特 型 
x <<= 1 ShlAssign 
x >>= 1 ShrAssign 
x&=1 BitAndAssign 
| BitXorAssign 
天 | 三 于 BitOrAssign 
闭 包 |x，y| x + y 


所 有 这 些 操作 符 在 链 式 操作 时 都 具有 左 关联 性 。 换 句 话 说， 类似 a - b - < 这 样 的 链 式 操 
作 会 被 分 组 为 (a - b) - c， 而 不 是 a - (b - c)。 可 以 像 这 样 链 式 操作 的 都 是 意料 之 中 的 
那些 操作 符 : 


* / % + - << >> & ^ | && || as 


比较 操作 符 、 赋 值 操作 符 和 范围 操作 符 〈.…) 压根 就 不 能 链 式 操作 。 


6.16 ”展望 


表达 式 在 我 们 看 来 是 “可 运行 的 代码 ”， 它 是 Rust 程序 中 可 以 编译 为 机 器 指令 的 部 分 。 然 
而 ， 表 达 式 在 整个 语言 中 只 占 一 小 部 分 。 

这 在 多 数 编程 语言 中 也 一 样 。 程 序 的 首要 任务 是 运行 ， 但 运行 并 不 是 唯一 的 任务 。 程 序 必 
须 相 互通 信 ， 必 须 方便 测试 ， 必 须 有 组 织 且 灵活 ， 这 样 才能 不 断 发 展 壮 大 。 程 序 必须 能 够 
与 其 他 团队 的 代码 和 服务 互 操作 。 即 便 只 是 运行 ， 像 Rust 这 样 静态 类 型 语言 的 程序 也 需要 
更 多 工具 去 组 织 数据 ， 而 不 仅仅 是 局 限于 元 组 和 数组 。 

接 下 来 ， 本 书 会 用 儿童 篇 幅 讨论 相关 的 特性 ， 比 如 赋予 程序 结构 的 模块 和 包 ， 以 及 赋予 数 
据 结 构 的 结构 体 和 枚 举 。 


不 过 ， 在 此 之 前 要 先 简单 地 介绍 一 下 错误 处 理 这 个 重要 的 话题 。 



























































第 7 章 


省 误 处 理 





我 早 就 知道 无 论 我 能 活 多 久 ， 这 种 事情 迟早 会 发 生 。 
一 一 George Bernard Shaw 论 死亡 

Rust 中 的 错误 处 理 非常 特别 ， 因 此 有 必要 单独 用 一 章 来 介绍 。 不 过 ， 这 里 的 思路 并 不 难 
理解 ， 只 是 可 能 比较 新 而 已 。 本 章 介绍 了 Rust 中 两 种 不 同 的 错误 处 理 机 制 : 诈 异 (panic) 
和 Result。 

普通 的 错误 使 用 Result 处 理 。 这 些 错误 通常 由 程序 外 部 的 事情 导致 ， 比 如 输入 错误 、 网 
络 中 断 ， 或 者 权限 问题 。 换 句 话 说， 这 种 错误 由 不 得 我 们 ， 即 使 写 得 再 完美 的 程序 也 会 
不 时 地 磁 到 。 本 章 大 多 数 篇 幅 会 讨论 这 种 错误 处 理 。 不 过 ， 我 们 会 先 讨 论证 异 ， 因 为 它 
相对 简单 。 
许 异 用 于 处 理 另 一 种 错误 ， 即 永远 不 该 发 生 的 错误 。 







































































7 一 诈 异 

















如 果 程 序 本 身 存在 bug， 编 译 器 就 会 这 异 。 比 如 : 
。 越界 访问 数组 
整数 被 零 除 
。 在 值 为 None 的 0ption 上 调用 .unwrap() 
。 断言 失败 
(还 有 一 个 同名 的 宏 ， 叫 pantc!()， 其 用 于 你 自己 的 代码 在 发 现 错误 时 主动 触发 诈 异 。 
panic!() 接受 可 选 的 printtn!() 风格 的 参数 ， 用 于 构建 错误 消息 。) 
考 良 讳言， 以 上 情形 的 共性 在 于 它们 都 由 程序 员 的 错误 所 导致。 因此 我 们 的 经 验 是 :“ 最 
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好 不 要 省 异 。 
可 人 哪 有 不 犯错 的 呢 。 在 这 些 错误 不 该 发 生 却 发 生 的 时 候 ， 该 怎么 办 ? 明显 地 ，Rust 会 给 
你 一 个 选择 : 要 么 这 异 发 生 时 展开 (unwind) 栈 ， 要 么 中 止 进程 。 展 开 是 默认 选项 。 


7.1.1 展开 栈 

当 海 盗 抢 劫 之 后 分 赃 时 ， 船 长 会 先 拿 走 一 半 ， 普 通 船员 则 按 比例 分 另 一 半 。 (海盗 不 喜欢 

小 数 ， 因 此 若 发 现 无 法 整除 ， 得 数 就 会 四 售 五 人 ， 最 终 多 出 来 的 部 分 会 分 给 船上 的 鹦 赵 。) 
fn pirate_share(total: uy64, crew_size: uysize) -> u64 { 


Let half = total / 2; 
half / crew_size as uy64 











} 
这 个 算法 一 直 沿 用 了 儿 个 世纪 ， 直 到 有 一 天 ， 抢 动 过 后 ， 船 长 发 现 自己 是 唯一 的 幸存 者 。 
如 果 给 这 个 函数 的 crew_size 参数 传人 0， 就 会 导致 被 零 除 。 在 C++ 中 ， 这 属于 未 定义 行 
为 。 而 在 Rust 中 ， 这 会 触发 证 异 ， 和 典型 的 处 理 过 程 如 下 。 
。 在 终端 打印 出 错误 消息 。 


thread 'main' panicked at 'attempt to divide by zero', pirates.rs:3780 
note: Run with “RUST_BACKTRACE=1” for a backtrace. 


如 果 你 像 错误 消息 中 所 说 的 那样 设置 了 RUST_BACKTRACE 环境 变量 ， 那 么 Rust 也 会 在 此 
时 将 栈 信息 转 存 起 来 。 
。 栈 被 展开 。 这 非常 像 C++ 的 异常 处 理 。 
当前 函数 使 用 的 任何 临时 值 、 局 部 变量 或 参数 都 会 按照 它们 创建 的 顺序 被 反 向 清除 。 
清除 意味 着 随 之 而 来 的 清理 : 程序 之 前 使 用 的 任何 String 或 vec 都 会 被 释放 ， 打 开 的 
File 会 被 关闭 ， 等 等 。 用 户 定义 的 drop 方法 也 会 被 调用 ， 参 见 13.1 节 。 对 于 pirate_ 
share() 这 个 特例 而 言 ， 没 什么 要 清理 的 。 
当前 函数 调用 被 清理 之 后 ， 控 制 流 交 还 至 调用 者 ， 再 以 同样 的 方式 清除 其 变量 和 参数 。 
接 下 来 是 那个 函数 的 调用 者 ， 总 之 沿 栈 逐 层 清 理 。 
。 最 后 ， 线 程 退 出 。 如 果 许 异 线程 是 主线 程 ， 那 么 整个 进程 退出 〈 退 出 码 非 0)。 
对 于 这 个 有 秩序 的 过 程 而 言 ， 这 异 这 个 词 可 能 容易 让 人 误解 。 许 异 不 是 崩 祺 ， 也 不 是 未 定 
义 行 为 。 相 反 ， 许 异 更 像 Java 的 RuntimeException 或 C++ 的 std: :Logic_error。 其 行为 
是 明确 定义 的 ， 只 是 不 应 该 发 生 而 已 。 
许 异 是 安全 的 ， 它 不 违反 Rust 的 任何 安全 规则 。 就 算 你 设法 在 使 用 标准 库 方法 时 触发 许 
异 ， 也 永远 不 会 在 内 存 中 导致 巧 空 指 针 或 初始 化 一 半 的 值 。 关 键 在 于 Rust 能 够 在 问题 扩 
大 化 之 前 捕获 无 效 的 数组 访问 或 其 他 类 似 的 错误 。 如 果 任 由 问题 扩大 化 ， 那 才 会 导致 不 安 
全 ， 因 此 Rust 会 展开 栈 。 不 过 进程 的 其 他 部 分 还 可 以 继续 运行 。 
诈 异 是 线程 级 别 的 。 一 个 线程 许 异 时 ， 其 他 线程 可 以 正常 运行 自己 的 业务 逻辑 。 第 19 章 
将 介绍 父 线程 如 何 发 现 子 线程 中 的 放 异 ， 并 优雅 地 处 理 相应 的 错误 。 
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还 有 一 种 方法 可 以 捕获 栈 展 开 ， 人 允许 许 异 线程 存活 并 继续 运行 。 标 准 库 函数 
std: :panic: :catch_unwind() 就 是 为 此 准备 的 。 本 章 不 会 介绍 如 何 使 用 该 函数 ， 这 里 只 想 
让 读者 知道 Rust 的 测试 套件 在 断言 失败 时 使 用 了 这 个 机 制 来 恢复 线程 执行 。( 在 编写 通过 
C 或 C++ 调用 的 Rust 代码 时 ， 这 个 机 制 也 是 必需 的 ， 因 为 在 非 Rust 代码 中 展开 栈 是 未 定 
义 的 行为 ， 具 体 细节 参见 第 21 章 。) 

理想 情况 下 ， 我 们 写 的 代码 应 该 是 完美 、 永 不 这 异 的 。 可 世间 哪 有 完 人 ? 为 保证 程序 更 加 
健壮 ， 可 以 使 用 线程 和 catch_unwind() 来 处 理 这 异 。 但 有 一 点 要 注意 ， 这 些 工 具 只 能 捕获 
展开 栈 的 这 异 ， 而 并 所 有 诈 异 都 会 展开 栈 。 


7.1.2 ”中 止 进 程 

展开 栈 是 默认 的 许 异 行为 ， 但 在 两 种 情况 下 Rust 不 会 展开 栈 。 

如 果 在 Rust 展开 第 一 个 函数 之 后 的 清理 期 间 .drop() 方法 触发 了 第 二 个 证 异 ， 那 么 这 个 诈 
异 会 被 认为 是 致使 的 。Rust 会 停止 展开 并 中 止 整 个 进程 。 

同样 ，Rust 的 谋 异 行为 是 可 自 定义 的 。 如 果 编 译 时 加 上 -C panic=abort， 那 么 编译 后 程序 
中 的 第 一 个 诈 异 就 会 立即 中 止 进程 。( 编 译 时 加 上 这 个 选项 ，Rust 则 无 须知 道 如 何 展开 栈 ， 
因此 能 够 减少 编译 后 代码 的 大 小 。) 

关于 Rust 中 的 许 异 就 介绍 到 这 儿 吧 。 没 什么 可 说 的 了 ， 因 为 常规 的 Rust 代码 没有 义务 处 
理 许 异 。 即 便 使 用 线程 或 catch_unwind()， 你 所 有 处 理 许 异 的 代码 也 很 可 能 只 集中 在 几 个 
地 方 。 指 望 程序 中 的 每 个 函数 都 能 预测 并 处 理 自己 代码 中 的 bug 是 不 现实 的 。 接 下 来 看 一 
下 由 其 他 因素 导致 的 错误 。 


7.2 结果 


Rust 没有 异常 。 相 反 ， 函 数 执行 失败 可 以 通过 一 个 返回 类 型 来 表示 : 

fn get weather(location: LatLng) -> Result<WeatherReport, io::Error> 
这 个 Result 类 型 表示 可 能 失败 。 调 用 get_weather() 函数 时 ， 要 么 会 返回 一 个 成 功 的 结 
果 Ok(weather)， 要 么 会 返回 一 个 错误 的 结果 Err(error_value)。 如 果 是 前 者 ，weather 
就 是 一 个 新 的 WeatherReport 值 ， 如 果 是 后 者 ，error_value 就 是 一 个 解释 出 了 什么 错 的 
Cow WEFFOFAE 
Rust 要 求 我 们 在 调用 这 个 函数 时 必须 写 一 些 错 误 处 理 逻 辑 。 如 果 不 对 这 个 Result 做 点 什 
么 ， 就 拿 不 到 WeatherReport。 而 如 果 没 有 使 用 Result 值 ， 编 译 器 就 会 给 出 警告 。 
第 10 章 将 介绍 标准 库 对 Result 的 定义 ， 以 及 如 何 自 定义 类 似 的 类 型 。 接 下 来 将 采取 “ 开 
清单 ”的 方式 ， 重 点 介绍 如 何 使 用 Result 来 正确 地 处 理 错误 。 


7.2.1 捕获 错误 
处 理 Result 最 周全 的 方式 其 实在 第 2 章 已 经 展示 过 了 ， 就 是 使 用 match 表达 式 。 
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match get_weather(hometown) { 
Ok(report) => { 
display_weather(hometown, &report); 
} 
Err(err) => { 
println!("error querying the weather: {}", err); 
schedule weather_retry(); 


} 











这 是 Rust 的 方式 ， 相 当 于 其 他 语言 中 的 try/catch。 这 是 正面 处 理 错误 ， 不 把 错误 抛 给 调 
用 者 的 做 法 。 

使 用 match 还 是 有 一 点 哆 唆 ， 因 此 Result<T，E> 针对 特定 的 常见 情况 提供 了 几 种 方法 ， 其 
中 每 个 方法 的 实现 中 都 有 一 个 match 表达 式 。( 要 了 解 所 有 Resutt 的 方法 ， 可 以 参考 在 线 
文档 。 这 里 列 出 来 的 只 是 其 中 最 常用 的 。) 























result.is_ok() 和 result.is_err() 返回 bool 值 ， 告 诉 我 们 result 是 成 功 的 结果 还 是 
错误 的 结果 。 

result.ok() 返回 0ption<T> 类 型 的 成 功 值 (如 果 有 的 话 )。 如 果 result 是 一 个 成 功 的 结果 ， 
就 返回 Some(success_value); 否则 ， 返 回 None， 而 丢弃 错误 值 。 

result.err() 返回 0ption<E> 类 型 的 错误 值 (如 果 有 的 话 )。 
result.unwrap_or(fallback) 返回 成 功 值 ， 如 果 result 是 成 功 的 结果 的 话 。 否 则 ， 它 返 
回 faLLback， 丢 弃 错 误 值 。 


// 对 南 加 州 比较 靠 谱 的 预测 
const THE_USUAL: WeatherReport = WeatherReport::Sunny(72); 











// 如 果 可 能 ， 取 得 实时 天 气 预报 

// 如 果 不 行 ， 以 惯常 的 值 作 后 备 

Let report = get weather(los_angeles).unwrap_or(THE_USUAL); 
display_weather(los_angeles, &report); 


这 是 对 .ok() 的 一 个 完美 奉 代 ， 因 为 返回 类 型 是 T 而 非 Option<T>。 当 然 ， 只 有 在 存在 
适当 后 备 值 的 情况 下 才 可 以 使 用 这 个 方法 。 
result.unwrap_or_else(fallback_fn) 是 类 似 的 ， 只 是 传 入 的 不 是 后 备 值 ， 而 是 一 个 函 
数 或 闭 包 。 这 个 方法 适合 计算 后 备 值 如 果 用 不 上 会 造成 浪费 的 情况 。 只 有 在 返回 错误 结 
果 时 才 会 调用 faLLback_fn。 

let report = 


get_weather (hometown) 
.Unwrap_or_eLse(|_err| vague_prediction(hometown)); 


(第 14 章 将 详细 介绍 闭 包 ) 

resutt.unwrap() 也 会 返回 成 功 值 (如果 resutt 是 成 功 的 结果 的 话 )。 不 过 ， 如 果 result 
是 错误 的 结果 ， 这 个 方法 则 会 话 异 。 这 个 方法 也 有 它 的 用 途 ， 稍 后 再 谈 。 
result.expect(message) 与 .unwrap() 相同 ， 只 不 过 你 需要 自己 提供 详 异 时 打印 到 控制 
台 的 消息 。 



























































最 后 ， 再 看 两 个 借用 Resutt 中 值 的 引用 的 方法 。 


result.as_ref() 将 ResuLt<T，E> 转换 为 ResuLt<&T，&E>， 即 借用 现 有 result 中 成 功 或 

错误 值 的 引用 。 

resuLt.as_mut() 也 一 样 ， 只 是 借用 了 可 修改 引用 。 返 回 类 型 为 ResuLt<&mut T，&mut E>。 
这 两 个 方法 之 所 以 有 用 ， 是 因为 前 面 列 出 的 方法 中 ， 除 了 .is_ok() 和 .is_err() 之 外 ， 其 
他 方法 都 会 用 掉 调用 它们 的 result 值 。 换 名 话说 ， 它 们 通过 self 参数 得 到 了 result 的 值 。 
有 时候， 访问 结果 中 的 数据 又 不 毁坏 它 是 很 方便 的 ， 而 这 正 是 .as_ref() 和 .as_mut() 派 上 
用 场 的 时 候 。 比 如 ， 假 设 你 想 调用 resutt.ok()， 但 需要 result 原封 不 动 。 那 么 可 以 写成 
result.as_ref().ok()， 这 样 就 只 会 借用 result， 返 回 一 个 0ption<&T> [而 站 Option<T>。 


7.2.2 ”结果 类 型 别名 
在 看 Rust 文档 时 ， 有 时 候 你 可 能 会 发 现 有 些 代 码 省 略 了 Resutt 的 错误 类 型 ; 

fn remove_file(path: &Path) -> Result<()> 
这 其 实 是 使 用 了 Result 类 型 别名 。 
类 型 别名 有 点 类 似 类 型 名 的 简写 。 模 块 经 常会 定义 Result 类 型 别名 ， 以 避免 模块 中 的 每 个 
函数 将 一 个 错误 类 型 重复 写 很 多 遍 。 比 如 ， 标 准 库 的 std: :io 模块 中 有 如 下 代码 : 

pub type Result<T> = result::Result<T, Error>; 
这 定义 了 一 个 公有 类 型 std::io::Result<T >， 它 以 硬 编 码 的 std::io::Error 作为 错误 类 
型 的 Result<T，E> 的 别名 。 实 际 使 用 中 ， 如 果 你 写 了 use std::io， 那 么 Rust 就 会 认为 
io: :Result<String> 是 ResuLt<String，io::Error> 的 简写 。 
因此 ， 当 在 线 文 档 中 出 现 类 似 Result<()> 这 样 的 内 容 时 ， 你 可 以 单 击 标识 符 Result， 查 看 
这 里 使 用 的 是 什么 类 型 的 别名 ， 进 而 得 出 错误 类 型 。 实 践 中 ， 通 常 可 以 根据 上 下 文 判断 错 


误 类 型 。 


7.2.3 打印 错误 
有 了 时候 处 理 错误 的 唯一 方式 可 能 就 是 把 错误 转 存 到 终端 ， 然 后 继续 执行 。 前 面 已 经 展示 了 
这 样 处 理 的 一 个 例子 : 
println!("error querying the weather: {}", err); 
标准 库 定义 了 几 种 错误 类 型 ， 名 字 都 很 无 聊 : std::io::Error、std::fmt::Error、std:: 
str::Utf8Error， 等 等 。 这 些 错误 都 实现 了 一 个 公共 接口 ， 即 std::error::Error 特 型 。 这 
意味 着 它们 具有 以 下 特点 。 
它们 都 可 以 使 用 printtn!() 来 打印 。 打 印 错误 时 以 { 作为 格式 描述 符 通 常 只 会 显示 简 
略 的 错误 消息 。 或 者 , 可 以 选择 使 用 {:?} 作为 格式 描述 符 , 此 时 会 看 到 错误 的 Debug 版 。 
虽然 看 起 来 有 点 乱 ， 但 会 包含 额外 的 技术 细节 。 
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// println!("error: {}"，err); 的 结果 
error: failed to lookup address information: No address associated with 
hostname 


// println!("error: {:?}"，err); 的 结果 

error: Error { repr: Custom(Custom { kind: Other, error: StringError( 
"failed to lookup address information: No address associated with 
hostname") }) } 


err.description() 返回 &str 类 型 的 错误 消息 。 
err.cause() 返回 一 个 0ption<&Error>， 这 是 触发 err 的 底层 错误 (如果 有 的 话 )。 


比如 ， 某 个 网 络 错误 可 能 导致 银行 交易 失败 ， 而 交易 失败 可 能 导致 你 的 游艇 被 收回 














o 


如 果 err.description() 是 "boat was repossessed" (游艇 被 收回 ) ， 那 么 err.cause() 
可 能 会 返回 一 个 关于 交易 失败 的 错误 。 这 个 错误 的 .description() 可 能 是 "failed to 
transfer $300 to United Yacht Supply” (给 United Yacht Supply 转账 300 美元 失败 )， 


信息 。 这 里 第 三 个 错误 就 是 根 原因 ， 因 此 它 的 .cause() 方法 会 返回 None。 
因为 标准 库 只 包含 非常 底层 的 特性 ， 所 以 标准 库 函 数 的 错误 通常 都 是 None。 





























而 它 的 .cause() 可 能 是 一 个 io: :Error， 包 含 导 致 所 有 这 些 麻 烦 的 特定 网 络 中 断 的 相关 


打印 错误 消息 不 一 定 会 打印 出 错误 原因 。 如 果 你 确实 需要 打印 所 有 可 用 信息 ， 可 以 使 用 这 
个 函数 : 


use std::error::Error; 
use std::io::{Write, stderr}; 


/// 把 错误 消息 转 存 到 stderr 
/// 
/// 如 果 在 构建 当前 错误 消息 或 写 入 stderr 时 发 生 另 一 个 错误 ， 则 忽略 该 错误 


fn print_ error(mut err: &Error) { 























Let _ = writeln!(stderr(), "error: {}", err); 
while Let Some(cause) = err.cause() { 
let = writeln!(stderr(), "caused by: {}", cause); 


err = Cause; 


上 


标准 库 的 错误 类 型 不 包含 栈 追 踪 信 息 ， 但 使 用 error-chain 包 可 以 方便 地 定义 自己 的 错误 
类 型 ， 以 支持 在 创建 时 获取 栈 追 踪 信 息 。 这 个 包 使 用 backtrace 捕获 栈 信息 。 


7.2.4 传播 错误 


企 尝 试 可 能 出 错 的 操作 时 ， 大 多 数 情况 下 我 们 并 不 希望 立即 捕获 和 处 到 
能 出 错 的 地 方 都 号 上 10 行 match 语句 ， 那 就 有 点 过 分 了 。 


这 时 候 ， 我 们 通常 会 希望 调用 者 来 处 理 错 误 。 换 名 话说， 我 们 和 希 


可 























传播 。 


Rust 的 ? 操作 符 可 以 传播 错误 。 可 以 在 任何 产生 Result 的 表达 式 后 面 添加 ?， 例 如 如 

















TT 





调用 的 结果 后 面 : 


错误 。 如 有 果 在 每 个 


望 错误 可 以 沿 调用 栈 向 上 


函数 





let weather = get_weather(hometown)?; 


~ 
灌 





乍 符 的 行为 取 雇 于 这 个 国 数 是 返回 一 个 成 功 结果 ， 还 是 返回 一 个 错误 结果 。 
。 如 果 是 成 功 结果 ， 那 么 它 会 打开 Resutt 并 取出 其 中 的 成 功 值 。 这 里 weather 的 类 型 不 


是 Result<WeatherReport，io::Error>， 而 是 简单 的 WeatherReport。 
。 如 果 是 错误 结果 ， 那 么 它 会 立即 从 闭合 函数 中 返回 ， 将 错误 结果 沿 调用 链 癌 上 传播 。 为 
确保 传播 成 功 ， 只 能 对 返回 类 型 为 Result 的 函数 使 用 ?。 


? 操作 符 并 不 神秘 。 同 样 的 操作 使 用 一 个 match 表达 式 也 能 实现 ， 只 不 过 太 长 了 : 


let weather = match get weather(hometown) { 
Ok(success_valuye) => success_value, 
Err(err) => return Err(err) 


























}; 
match 表达 式 与 ? 的 唯一 区 别 在 于 类 型 和 转换 方面 的 细节 。 下 一 节 会 详细 探讨 这 个 话题 。 
在 较 早 的 代码 中 ， 你 可 能 会 看 到 try!() 宏 ， 这 是 在 Rust 1.13 中 引入 ? 操作 符 之 前 用 于 传 
播 错误 的 典型 方式 。 

let weather = try!(get weather(hometown)); 
try!() 宏 会 扩展 为 一 个 类 似 上 面 这 样 的 match 表达 式 。 
人 们 很 容易 忽视 程序 出 错 的 可 能 性 ， 特 别 是 在 与 操作 系统 打交道 的 代码 中 ， 出 错 的 概率 就 
更 高 了 。 因 此 ， 黄 至 有 时 候 你 会 发 现在 一 个 函数 的 每 一 行 的 末尾 都 会 跟着 一 个 ? 操作 符 : 


use std::fs; 
use std::io; 
use std::path::Path; 








一 














fn move_all(src: &Path，dst: &Path) -> io::Result<()> { 
for entry_result in src.read_dir()? { // 打开 dir 可 能 失败 
let entry = entry_result?; // 读 取 dir 可 能 失败 
Let dst file = dst.join(entry.file name()); 
fs::rename(entry.path(), dst_file)?; // 重 命名 可 能 失败 


} 
ok(()) // 哇 哦 ! 

















7.2.5 ”处 理 多 种 错误 类 型 
我 们 经 常会 碰 到 多 种 错误 同时 出 现 的 情况 。 假 设 就 是 从 文本 文件 中 读 取 数值 。 


use std::io::{self, BufRead}; 





/// 从 文本 文件 中 读 取 整数 
/// 这 个 文件 中 的 每 一 行 应 该 都 有 一 个 数值 
fn read_numbers(file: &mut BufRead) -> Result<Vec<i64>, io::Error> { 
Let mut numbers = vec![]; 
for line_result in file.lines() { 
let line = line result?; // 读 取 行 的 内 容 可 能 失败 
Numbers.push( line.parse()?); // 解析 整数 有 可 能 失败 
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Ok(numbers) 
} 


Rust 会 报 一 个 编译 错误 : 


numbers.push(line.parse()?); // 解析 整数 有 可 能 失败 
^^A^A^AA^AAAAAAA^ the trait “std::convert::From<std::num::ParseIntError>. 
is not implemented for ‘std::io::Error. 


关于 报错 信息 中 提 到 的 特 型 (trait)， 可 能 等 到 看 过 第 11 章 后 会 更 容易 理解 。 眼 下 ， 只 要 
知道 Rust 在 抱 候 它 不 能 把 std: :num: :ParseIntError 值 转换 为 std::io::Error 就 可 以 了 。 
这 里 的 问题 是 从 文件 中 读 取 一 行内 容 并 解析 为 整数 时 会 产生 两 种 不 同 的 潜在 错误 类 型 ， 
其 中 ，line_result 的 类 型 是 ResuLt<String，std::io::Error>， 而 Line.parse() 的 类 型 
是 ResuLt<iti64，std::num::ParseIntError>。 国 数 read_numbers() 的 返回 类 型 只 能 容纳 
io::Error 错误 。 为 此 ，Rust 会 尝试 把 ParseIntError 转换 为 io::Error， 但 这 种 转换 的 可 
能 性 不 存在 ， 因 此 我 们 就 得 到 了 一 个 类 型 错误 。 
处 理 这 种 情况 的 方法 不 止 一 种 。 比 如 ， 第 2 章 用 到 的 为 曼 德 布 洛 特集 合 创建 图 像 文件 的 
image 包 定 义 了 自己 的 错误 类 型 ImageError， 并 实现 了 从 io::Error 及 其 他 几 种 错误 类 型 到 
ImageError 的 转换 。 如 果 你 想 采 取 这 个 路 线 ， 那 么 可 以 试 一 试 前 面 提 到 的 error-chain 包 ， 
它 可 以 帮 你 只 用 几 行 代码 就 定义 出 灵活 的 错误 类 型 。 
另 一 个 更 简单 的 方法 是 使 用 Rust 内 置 的 特性 。 所 有 标准 库 的 错误 类 型 都 可 以 转换 为 
Box<std: :error: :Error> 类 型 ， 其 含义 为 “任何 错误 "。 因 此 ， 处 理 多 种 错误 类 型 的 一 个 简 
单方 案 就 是 定义 如 下 类 型 别名 : 

type GenError = Box<std::error::Error>; 

type GenResuLt<T> = Result<T, GenError>; 


然后 ， 把 read_numbers() 的 返回 类 型 改 为 GenResuLt<Vec<i64>>。 这 么 一 改 ， 国 数 编译 就 通 
过 了 。? 操作 符 会 根据 需求 自动 将 任意 错误 类 型 转换 为 GenError。 

顺便 提 一 下 ，? 操作 符 使 用 了 一 个 标准 库 方 法 来 实现 上 述 自 动 转换 。 实 际 上 你 自己 也 可 以 
使 用 该 方法 。 要 把 任意 错误 转换 为 GenError 类 型 ， 可 以 调用 GenError::from(): 


Let io error = io::Error::new( // 创建 自己 的 to: :Error 
io::ErrorKind::0ther, "timed out"); 
return Err(GenError::from(io_error)); // 手工 转换 为 GenError 


第 13 章 将 介绍 From 特 型 及 其 from() 方法 。 


使 用 GenError 的 缺点 在 于 返回 类 型 不 再 精确 地 传达 调用 者 可 以 预测 的 错误 类 型 。 调 用 者 必 
须 做 好 各 方面 准备 。 
如 果 调 用 的 函数 返回 GenResult， 但 你 只 想 处 理 一 种 特定 的 错误 ， 而 让 其 他 所 有 错误 传播 
出 去 ， 可 以 使 用 泛 型 方法 error.downcast_ref::<ErrorType>()。 如 果 恰 好 是 你 想 要 的 那个 
错误 类 型 ， 那 么 该 方法 会 借用 对 这 个 错误 的 引用 : 






























































Loop { 
match compile project() { 
Ok(()) => return Ok(()), 
Err(err) => { 
if let Some(mse) = err.downcast_ref::<MissingSemicolonError>() { 
insert_semicolon_in_source code(mse.file(), mse.line())?; 


continue; // 再 试 ! 


return Err(err); 
} 
} 
} 


很 多 语言 为 完成 此 类 操作 提供 了 内 置 语法 ， 实 际 上 完全 没有 必要 。Rust 只 是 专门 为 此 提供 
了 = 个 力 洁 


7.2.6 ”处 理 “ 不 会 发 生 ” 的 错误 
某 些 情况 下 ， 我 们 就 知道 某 个 错误 不 会 发 生 。 比 如 ， 假 设 我 们 正在 写 一 段 代 码 来 解析 一 个 
配置 文件 ， 写 着 写 着 发 现 文件 里 接 下 来 的 数据 是 一 个 数字 字符 串 : 
if next_ char.is digit(10) { 
let start = current_ index; 


current_index = skip digits(&line, current_index); 
Let digits = &line[start..current index]; 











我 们 想 把 这 个 数字 字符 串 转 换 成 实际 的 数值 。 有 一 种 标准 的 方法 专门 做 这 件 事 : 
Let num = digits.parse::<y64>(); 


那么 问题 来 了 : str.parse::<u64>() 方法 并 不 返回 u64， 而 是 返回 一 个 Result。 转 换 可 能 
失败 ， 因 为 有 些 字符 串 不 是 数值 : 


"bleen" .parse::<u64>() // ParseIntError: 无 效 数 字 
但 在 这 里 ， 我 们 恰好 知道 digits 完全 由 数字 组 成 。 那 么 应 该 做 点 什么 ? 


如 果 我 们 写 的 代码 返回 GenResutt， 那 可 以 附加 一 个 ?， 然 后 就 没事 了 。 否 则 ， 就 会 出 现 要 
为 不 会 发 生 的 错误 编写 错误 处 理 代码 的 恼人 局 面 。 最 好 的 办 法 是 使 用 .unwrap()， 也 就 是 
前 面 提 到 过 的 Resutt 的 一 个 方法 。 


Let num = digits.parse::<y64>().unwrap(); 
这 样 跟 使 用 ? 差不多 ， 只 不 过 在 判断 出 错时 ， 也 就 是 会 发 生 错误 时 ， 代 码 会 证 异 。 


事实 上 ， 在 特殊 情况 下 ， 我 们 确实 可 能 判断 出 错 。 如 果 输 入 包含 足够 长 的 数字 字符 串 ， 那 
么 转换 后 的 数值 会 因为 太 大 而 难以 放 到 u64 里 。 


"99999999999999999999" .parse::<u64>() // 溢出 错误 
在 这 种 特殊 情况 下 使 用 .unwrap() 就 成 了 一 个 bug。 而 有 问题 的 输入 不 应 该 导致 证 异 。 
话 虽 如 此 ， 但 确实 存在 Resutt 值 真 的 不 能 是 错误 的 这 种 情况 。 比 如 ， 在 第 18 章 中 ， 
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Write 特 型 为 文本 和 二 进 制 输出 定义 了 一 组 公共 方法 〈(.write() 等 )。 所 有 这 些 方法 都 返 
回 io: :ResuLtt， 如 果 你 恰好 要 写 入 一 个 vec<u8>， 那 就 不 能 失败 。 此 时 ， 使 用 .unwrap() 
或 .expect(message) 来 省 略 Result 是 可 以 接受 的 。 

如 果 错 误 代 表 的 是 一 个 非常 严格 或 奇怪 的 条 件 ， 而 你 希望 在 出 错时 许 异 ， 那 也 可 以 使 用 这 
些 方法 。 


fn print_fiLe_age(fiLename: &Path，Last_modified: SystemTime) { 
Let age = last modified.elapsed().expect("system clock drift"); 




















} 
在 这 里 ，.elapsed() 方法 只 有 当 系 统 时 间 早 于 文件 创建 时 间 时 才 会 失败 。 如 果 文 件 是 最 近 
刚 创 建 的 ， 而 系统 时 钟 在 程序 运行 时 被 向 后 调整 过 ， 那 就 有 可 能 满足 失败 条 件 。 根 据 使 用 
代码 的 方式 ， 在 这 种 情况 下 触发 省 异 而 不 是 处 理 错误 或 将 错误 传播 给 调用 者 ， 倒 不 失 为 一 
种 合理 的 做 法 。 


7.2.7 忽略 错误 

偶尔 ， 我 们 也 会 希望 忽略 某 个 错误 。 比 如 ， 在 print_error() 函数 中 ， 我 们 必须 处 理 一 种 

不 太 可 能 的 情况 ， 即 打印 错误 时 触发 另 一 个 错误 。 这 是 有 可 能 的 ， 比 如 ， 把 stderr 通过 管 

道 发 送 到 另 一 个 进程 ， 而 该 进程 被 杀 死 了 。 因 为 对 这 种 类 型 的 错误 ， 我 们 几乎 没什么 可 做 

的 ， 所 以 想 忽略 它 。 但 Rust 编译 器 会 警告 说 存在 未 使 用 的 Resutt 值 ; 
writeLn!(stderr()，"error: {"，err); // 警告 : 未 使 用 的 结果 

惯用 法 tet _ = ... 可 以 用 来 禁止 这 种 警告 ; 


Let ”= writeLn!(stderr()，"error: {}"， err); // 没 问 题 ， 忽 略 结果 


7.2.8 在 main() 中 处 理 错 误 
在 产生 Result 的 大 多 数 情 况 下 ， 让 错误 冒 泡 到 调用 者 是 正确 的 做 法 。 这 也 是 ? 在 Rust 中 
只 有 一 个 字符 的 原因 。 前 面 我 们 也 看 到 过 ， 在 某 些 程序 里 很 多 行 末 尾 有 它 。 
但 是 ， 如 果 错 误 的 传播 路 径 足 够 长 ， 最 终 抵达 了 main()， 就 不 能 继续 传播 了 。main() 不 能 
使 用 ?， 因 为 它 的 返回 类 型 不 是 Result。 

fn main() { 

calculate_tides()?; // 错误 : 不 能 把 麻烦 再 向 外 传播 了 

} 

在 main() 中 处 理 错误 的 最 简单 方式 是 使 用 .expect()。 


fn main() { 
calculate_tides().expect("error"); // 麻烦 到 此 为 止 
} 


如 果 calculate_tides() 返回 一 个 错误 结果 ，.expect() 方法 则 会 诈 异 。 主 线程 中 的 诈 异 会 
打印 错误 消息 ， 然 后 以 一 个 非 零 退出 码 退 出 。 这 基本 上 可 以 算是 我 们 想 要 的 结果 。 对 小 程 








































































































序 来 说 ,我们 一 直 都 是 这 么 干 的。 小 程序 是 一 切 程 序 的 开始 。 
不 过 ， 错 误 消 息 还 是 有 点 让 人 紧张 : 


$ tidecalc --planet mercury 

thread 'main' panicked at 'error: "moon not found"', /buildslave/rust-buildbot/s 
lave/nightly-dist-rustc-linux/build/src/libcore/result.rs:837 

note: Run with ‘RUST_BACKTRACE=1. for a backtrace. 


背 误 消息 混在 了 一 堆 文 字 中 间 。 同 样 ， 在 这 种 情况 下 RUST_BACKTRACE=1 不 是 个 好 主意 。 最 
好 还 是 自己 来 打印 错误 消息 : 
fn main() { 
if let Err(err) = calculate tides() { 


print_error(&err); 
std::process: :exit(1); 








} 


以 上 代码 使 用 了 if let 表达 式 ， 只 在 调用 calculate_tides() 返回 错误 结果 时 打印 错误 
消息 。 有 关 if let 表达 式 的 详细 解释 ， 参 见 第 10 章 。 而 print_error 函数 的 定义 可 以 在 
7.2.3 节 找 到 。 


现在 ,输出 简洁 明了 : 


$ tidecalc --planet mercury 
error: moon not found 


7.2.9 声明 自 定义 错误 类 型 

假设 你 在 编写 一 个 新 的 JSON 解析 器 ， 而 且 想 让 它 拥 有 自己 的 错误 类 型 。( 本 书 至 今 尚未 介 
绍 用 户 定义 类 型 ， 接 下 来 几 章 会 介绍 。 错 误 类 型 比较 有 用 ， 这 里 先 大 概 看 一 看 。) 

以 下 大 概 是 你 需要 写 的 最 低 限 度 的 代码 ， 


// json/src/error .rs 




















#[derive(Debug, Clone)] 
pub struct JsonError { 
pub message: String, 
pub Line: usize, 
pub column: usize, 


} 


这 个 结构 体 可 以 通过 json: :error::JsonError 调用 ， 在 想 要 创建 一 个 这 种 类 型 的 错误 时 ， 
可 以 这 样 写 : 


return Err(JsonError { 
message: "expected ']' at end of array".to_string(), 
line: current_line, 
column: current_column 


}); 
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没 问 题 。 不 过 ， 如 果 你 想 让 这 个 错误 类 型 的 行为 接近 标准 错误 类 型 ， 正 如 你 的 库 用 户 所 期 
待 的 那样 ， 那 么 还 要 多 写 一 些 逻 辑 : 


use std; 
use std::fmt; 





// 错误 应 该 可 以 打印 出 来 
impl fmt::Display for JsonError { 
fn fmt(&self, f: &mut fmt::Formatter) -> Result<(), fmt::Error> { 
write!(f, "{} ({}:{})", self.message, self.line, self.column) 
} 
} 


// 错误 应 该 实现 std: :error::Error 特 型 
impl std::error::Error for JsonError { 
fn description(&self) -> &str { 

&self.message 
} 
} 


同样 ， 这 里 的 impl 关键 字 、self 还 有 其 他 细节 ， 都 会 在 接 下 来 的 几 章 里 介绍 。 


7.2.10 为 什么 是 结果 
至 此 ， 我 们 应 该 可 以 理解 Rust 选择 Result 而 不 是 异常 的 用 意 所 在 了 。 以 下 是 设计 的 要 点 。 


。 Rust 要 求 程序 员 在 所 有 可 能 发 生 错误 的 地 方 做 出 某 种 决定 ， 并 记录 在 代码 中 。 这 没有 任 
何 问题 ， 毕 劳 人 很 容易 因为 琉 忽 而 忘记 处 理 错 误 。 
最 常见 的 决定 是 让 错误 向 外 传播 ， 而 这 只 需要 写 一 个 字符 ?。 这 样 错误 就 不 会 像 C 和 
Go 中 那样 弄 乱 你 的 代码 了 。 而 且 传 播 路 径 是 可 见 的 : 就 算是 一 堆 代 码 ， 只 需 用 眼睛 扫 
一 下 ， 就 能 知道 错误 会 从 哪些 地 方 传播 出 来 。 
由 于 每 个 函数 的 返回 类 型 都 包含 了 出 错 的 可 能 ， 因 此 哪个 函数 可 以 失败 ， 哪 个 函数 不 能 
失败 非常 清晰 。 如 果 把 一 个 函数 修改 为 可 以 失败 ， 那 就 要 修改 其 返回 类 型 ， 而 编译 器 会 
旧 导 你 更 新 该 函数 的 下 游 调用 者 。 

。 Rust 检查 是 否 使 用 了 Result 值 ， 因 此 不 可 能 静默 传递 某 个 错误 (这 是 C 中 的 一 个 常见 
错误 )。 
Result 也 是 一 个 数据 类 型 ， 所 以 在 同一 个 集合 中 存储 成 功 和 错误 结果 很 简单 。 因 而 对 
部 分 成 功 的 结果 建 模 也 很 容易 。 比 如 ， 你 要 编写 一 个 从 文本 文件 中 加 载 几 百 万 条 记录 的 

程序 ， 那 你 必须 有 可 以 应 对 大 多 数 情况 下 成 功 、 少 数 情况 下 失败 的 方案 。 此 时 就 可 以 在 
内 存 中 通过 一 个 Result 向 量 来 表示 这 种 情况 。 

如 此 设计 的 代价 ， 就 是 你 会 发 现 自己 在 Rust 中 要 比 在 其 他 语言 中 花 更 多 时 间 来 思 芳 和 权衡 

错误 处 理 。 跟 其 他 很 多 方面 一 样 ，Rust 对 待 错误 处 理 的 态度 比 你 过 去 习惯 的 要 稍微 严格 一 

些 。 对 于 系统 编程 来 说 ， 这 样 是 值得 的 。 
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这 是 对 Rust 主题 的 一 个 小 备注 : 系统 编程 语言 也 可 以 有 这 么 灵活 的 机 制 。 
一 一 Robert O'Callahan, “Random Thoughts on Rust: Crates.io and IDES” 


假设 我 们 要 写 一 个 程序 来 模拟 蕨 类 植物 从 细胞 直到 长 大 的 生成 过 程 。 而 这 个 程序 ， 也 与 蕨 
类 植物 相似 ， 一 开始 代码 非常 简单 ， 可 能 所 有 代码 都 写 在 一 个 文件 里 (就 是 想法 的 孢子 )。 
随 着 细胞 不 断 分 裂 ， 蕨 类 植物 将 开始 长 出 内 部 结构 。 不 同 的 分 支 各 有 不 同 的 用 途 。 于 是 程 
序 也 会 发 展 出 多 个 文件 ， 最 终 遍 布 整整 一 个 目录 树 。 某 一 天 ， 这 个 程序 可 能 会 成 为 整个 软 
件 生态 系统 的 重要 组 成 部 分 。 

本 章 介 绍 了 Rust 实现 代码 组 织 的 相关 特性 : 包 和 模块 。 具 体内 容 将 涉及 项 目 成 长 过 程 中 可 
能 遇 到 的 方方面面 ， 比 如 如 何 为 Rust 代码 编写 文档 、 如 何 测试 、 如 何 屏蔽 不 需要 的 编译 警 
告 、 如 何 使 用 Cargo 管理 项 目 依赖 和 进行 版 本 控制 、 如 何在 crates.io 上 发 布 开源 库 ， 等 等 。 


8.1 包 


Rust 程序 由 包 组 成 。 每 个 包 都 是 一 个 Rust 项 目 ， 包 含 一 个 独立 的 库 或 可 执行 文件 的 全 部 
源 代码 ， 以 及 相关 的 测试 、 示 例 、 工 具 、 配 置 和 其 他 东西 。 对 我 们 要 实现 的 艾 类 植物 模拟 
程序 而 言 ， 可 能 需要 用 到 提供 3D、 生 物 信息 和 并 行 计算 功能 等 的 第 三 方 库 。 这 些 库 都 以 
包 的 形式 发 布 ， 如 图 8-1 所 示 。 
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mandelbrot 


image 


png num 


Qi 


flate2 rand 


WeaqSss0J2 


color_quant lzw ibe 


std 














8-1: 一 个 包 及 其 依赖 


要 了 解 包 是 什么 ， 以 及 它们 如 何 协作 ， 最 简单 的 办 法 就 是 对 一 个 使 用 了 依赖 的 已 有 项 目 
运行 cargo build 命令 ， 同 时 加 上 --verbose 标记 。 我 们 用 2.6.6 节 “ 并 发 的 曼 德 布 洛 特 程 
序 ” 作 为 例子 ， 结 果 如 下 所 示 : 


$ cd mandelbrot 
$ cargo clean # 删除 之 前 编译 的 代码 
$ cargo build --verbose 
Updating registry ‘https://github.com/rust-lang/crates.io-index. 
Downloading image vO.6.1 
Downloading crossbeam vO.2.9 
Downloading gif vO.7.0 
Downloading png vO.4.2 


... (downloading and compiling many more crates) 


Compiling png vO.4.2 
Running ‘rustc .../png-0.4.2/src/lib.rs 
--Crate-name png 
--Crate-type lib 
--extern num=.../Libnum-a2e6e61627ca7fe5.rLib 
--extern infLate=.../LibinfLate-331fc425bf167339.rLib 
--extern flate2=.../libflate2-857dff75f2932d8a.rlib 


Compiling image vO.6.1 
Running ‘rustc .../image-0.6.1/./src/lib.rs 
--Crate-name image 
--Crate-type lib 
--extern png=.../Libpng-16c24f58491a5853.rLib 


Compiling mandelbrot v0.1.0 (file://.../mandelbrot) 
Running ‘rustc src/main.rs 
--Crate-name mandelbrot 
--Crate-type bin 
--extern Crossbeam=.../Libcrossbeam-ba292320058da7df.rLib 
--extern image=.../Libimage-254ec48c8f0684f2.rLib 


$ 
为 增强 可 读 性 ， 以 上 代码 对 rustc 命令 行 做 了 格式 化 ， 而 且 删 除了 很 多 与 讨论 无 关 的 编译 
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器 选项 ， 代 之 以 省 略 号 〈.….)。 
有 读者 大 概 还 记得 ， 在 那个 例子 完成 时 ， 曼 德 布 阁 特 程序 的 main.rs 文件 中 有 3 个 extern 


crate 声明 : 
extern crate num; 


extern crate image; 
extern crate crossbeanm; 


这 几 行 声明 只 是 告诉 Rust，num、image 和 crossbean 都 是 外 部 库 ， 并 不 是 曼 德 布 阁 特 程序 
本 身 的 代码 。 


同时 ， 在 Cargo.toml 文件 里 ， 我 们 也 为 每 个 包 指定 了 对 应 的 版 本 : 


[dependencies] 
num = "0.1.27" 
image = "0.6.1" 
crossbeam = "0.2.8" 


此 处 依赖 指 的 是 当前 项 目 用 到 的 其 他 包 ， 也 就 是 我 们 要 依赖 的 代码 。 这 些 包 在 以 Rust 
为 开源 包 搭 建 的 网 站 crates.io 上 都 能 找到 。 比 如 ， 在 浏览 器 中 打开 cratesio， 然 后 搜索 
“image”， 就 可 以 找到 image 库 。crates.io 上 每 个 包 的 页 面 都 有 链接 指向 相关 文档 和 源 代 
码 ， 以 及 像 image = "09.6.1" 这 样 的 可 以 直接 复制 到 Cargo.toml 文件 中 的 一 行 配 置 。 这 里 
的 版 本 号 就 是 在 写 程序 时 这 3 个 包 的 最 新 版 本 。 


Cargo 的 输出 讲述 了 这 里 发 生 的 一 切 。 在 运行 cargo build 时 ，Cargo 首先 从 crates.io 上 下 载 
了 这 3 个 包 指 定 版 本 的 源 代码 。 然 后 ， 它 读 取 这 些 包 的 Cargo.toml 文件 ， 并 下 载 它 们 的 依 
赖 ， 如 此 递归 下 去 。 比 如 ，0.6.1 版 image 包 源 代码 的 Cargo.toml 文件 里 列 出 了 以 下 依赖 : 

[dependencies] 

byteorder = "0.4.0" 

num = "0,.1;.27" 


enum_primitive = "0.1.0" 
glob = "0.2.10" 


看 到 这 些 ，Cargo 就 知道 使 用 image 前 必须 先 取 得 这 些 包 。 稍 后 ， 我 们 会 介绍 如 何 告 诉 
Cargo 从 Git 存储 库 或 本 地 文件 系统 而 不 是 crates.io 上 取得 源 代码 。 


一 旦 取得 了 所 有 的 源 代码 ，Cargo 就 会 编译 所 有 包 。 它 会 对 项 目 依赖 的 每 个 包 都 运行 一 次 
rustc， 也 就 是 Rust 编译 器 。 在 编译 第 三 方 库 时 ，Cargo 会 使 用 --crate-type Lib 选项 。 
这 会 告诉 rustc 不 要 去 找 main() 国 数 ， 而 是 生成 一 个 .rlib 文件 ， 其 中 包含 编译 后 的 代码 ， 
这 些 代 码 的 格式 可 供 之 后 的 rustc 命令 用 作 输 入 。 在 编译 程序 时 ，Cargo 会 使 用 - -crate- 
type bin 选项 ， 编 译 结果 将 是 一 个 针对 目标 平台 的 二 进 制 可 执行 文件 ， 比 如 在 Windows 上 
就 是 mandelbrot.exe。 


运行 每 个 rustc 命令 时 ，Cargo 会 通过 --extern 选项 给 出 当前 包 用 到 的 每 个 库 的 文件 名 。 
这 样 ， 当 rustc 看 到 extern crate crossbeam; 这 行 代码 时 ， 它 就 知道 到 磁盘 的 什么 位 置 去 
找 这 个 库 编译 后 的 代码 了 。Rust 编译 器 需要 访问 -lib 文件 ， 因 为 其 中 包含 第 三 方 库 编译 后 
的 代码 。Rust 会 将 这 些 代码 静态 链接 到 最 终 的 可 执行 文件 上 。.rlib 文件 也 包含 类 型 信息 ， 
Rust 可 以 据 此 检查 我 们 代码 中 用 到 的 库 特 性 确实 在 对 应 的 包 里 存在 ， 从 而 保证 正确 地 使 用 
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它们 。 这 个 文件 里 还 包含 包 的 公共 内 联 函 数 、 泛 型 和 宏 的 一 个 副本 ， 这 些 特 性 直到 Rust 遇 
到 调用 它们 的 代码 时 才 会 编译 为 机 器 码 。 
cargo build 支持 很 多 选项 ， 其 中 大 多 数 本 书 将 不 作 介绍 。 不 过 ， 这 里 还 是 要 提 一 下 : 
cargo build --release 产生 优化 的 代码 。 优 化 的 代码 运行 更 快 ， 但 编译 时 间 比 较 长 ,而且 
不 会 检查 整数 溢出 ， 还 会 跳 过 debug_assert!() 断言 ， 另 外 它们 针对 诺 异 生成 的 栈 追 踪 信 
息 一 般 不 太 可 靠 。 


构建 分 析 


表 8-1 总 结 了 可 以 放 到 Cargotoml 文件 中 的 几 种 配置 ， 它 们 会 影响 cargo 生成 的 rustc 合 
令 行 。 


表 8-1: 构建 分 析 


























和 人 Cargo.toml 使 用 的 区 块 
cargo build [profile.dev] 

cargo build --release [profile.releasel] 
cargo test [profile.test] 


默认 执行 的 构建 通常 就 可 以 了 ， 但 有 时 候 也 许 需要 使 用 分 析 程 序 ， 即 一 个 可 以 度量 你 的 
程序 是 哪 部 分 花 了 太 多 CPU 时 间 的 程序 。 要 从 分 析 程 序 获得 最 全 面 的 数据 ， 需 要 同时 局 
用 优化 〈 通 常 只 在 发 布 构建 时 启用 ) 和 调试 (通常 只 在 调试 构建 时 启用 ) 符号 (Symbol) 。 
如 果 想 两 者 都 启用， 必须 在 Cargo.toml 中 添加 如 下 代码 : 

[profile.release] 

debug = true  # 在 发 布 构建 中 启用 调试 标记 
这 里 的 debug 设置 控制 rustc 中 的 -g 选项 。 有 了 这 个 配置 ， 再 执行 cargo build --release，, 
就 可 以 得 到 一 个 带 有 调试 符号 的 二 进 制 文件 。 优 化 设置 不 受 影 响 。 


Cargo 文档 中 给 出 了 可 以 调整 的 其 他 很 多 设置 。 


8.2 模块 


模块 既是 Rust 的 命名 空间 ， 也 是 函数 、 类 型 、 常 量 等 构成 Rust 程序 或 库 的 容器 。 包 主 
要 解决 项 目 间 代 码 共 享 的 问题 ， 而 模块 主要 解决 项 目 内 代码 组 织 的 问题 。 下 面 就 是 一 个 
模块 : 


mod spores { 
use cells::Cell; 









































/// 细胞 (cell) 由 成 熟 的 蕨 类 产生 。 在 蕨 类 的 生命 期 内 ， 它 会 随 风 传 播 。 
/// 抱 子 会 成 长 为 原 叶 体 ， 即 一 个 完全 独立 的 有 机 体 ， 最 大 有 5 训 米 。 原 叶 体 
/// 会 产生 接合 子 ， 接 合子 则 会 长 成 新 的 蕨 类 〈 植 物 的 性 别 很 复杂 ) 

pub struct Spore { 














/// 模拟 细胞 分 裂 产生 孢子 
pub fn produce_spore(factory: &mut Sporangium) -> Spore { 














/// 混合 基因 以 备 细胞 分 裂 〈 细 胞 间 期 ) 
fn recombine(parent: &mut Cell) { 


} 





























} 


模块 是 特性 项 (item) 的 集合 ， 比 如 这 个 例子 中 的 结构 体 Spore 和 两 个 函数 。 关 键 字 pub 
用 于 标记 公有 或 公开 的 特性 项 ， 以 便 在 模块 外 部 能 够 访问 它 。 任 何 没有 标记 为 pub 的 特性 








项 都 是 模块 私有 的 。 
let s = spores::produce_spore(&mut factory); // 可 以 


spores::recombine(&mut cell); // 错误 : recombine 是 私有 的 
模块 可 以 租 套 ， 包 含 一 系列 子 模块 的 模块 也 是 很 常见 的 : 


mod plant_structures { 
pub mod roots { 


pub mod stems { 


pub mod Leaves { 


} 
} 





以 这 种 代码 组 织 方 式 当 然 可 以 写 出 完整 的 程序 ， 把 大 量 代码 和 层 层 徐 套 的 模块 都 放 在 一 个 
源 文件 里 。 但 这 样 组 织 代码 显然 不 够 灵活 ， 因 此 还 有 更 好 的 方式 。 


8.2.1 把 模块 写 在 单独 的 文件 中 
模块 也 可 以 这 样 写 : 
mod spores; 
前 面 ， 我 们 的 代码 中 也 写 出 了 spores 模块 的 代码 体 ， 即 包含 在 花 括 号 中 的 内 容 。 这 号 


告诉 Rust 编译 器 ，spores 模块 保存 在 一 个 单独 的 名 叫 spores.rs 的 文件 里 : 
// spores.rs 





于 
SY 
AAA 
on 








/// 细胞 (ceLL) 由 成 熟 的 蕨 类 产生 
pub struct Spore { 


} 
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/// 模拟 细胞 分 裂 产生 抱 子 


pub fn produce_spore(factory: &mut Sporangium) -> Spore { 
} 


/// 混合 基因 以 备 细胞 分 裂 〈 细 胞 间 期 ) 
fn recombine(parent: &mut Cell) { 


上 


spores.rs 只 包含 构成 模块 的 特性 项 。 换 句 话说， 包含 模块 的 文件 里 不 再 需要 任何 多 余 的 代 
码 来 声明 这 是 一 个 模块 。 

写 在 文件 中 的 spores 模块 与 前 面 介绍 的 spores 模块 的 唯一 区 别 是 代码 保存 在 了 不 同 的 地 
方 。 关 于 公有 还 是 私有 的 声明 规则 在 两 种 写法 下 都 适用 。 事 实 上 ， 就 算 模 块 写 在 了 单独 的 
文件 中 ，Rust 也 不 会 单独 编译 模块 。 构 建 Rust 包 时 ， 会 重新 编译 包 中 的 所 有 模块 。 


模块 也 可 以 有 自己 的 目录 。Rust 在 看 到 mod spores; 时 ， 既 会 检查 是 否 存在 spores.rs 文件 ， 
也 会 检查 是 否 存在 spores/mod.rs 文件 。 如 果 两 个 文件 都 存在 ， 或 者 都 不 存在 ， 就 会 报错 。 
这 个 例子 使 用 的 是 spores.rs 文件 ， 因 为 spores 模块 没有 任何 子 模块 。 再 考虑 一 下 前 面 写 
过 的 plant_structures 模块 。 如 果 想 把 这 个 模块 还 有 它 的 3 个 子 模块 都 保存 在 各 自 的 文件 
中 ， 那 项 目的 目录 结构 就 会 变 成 这 样 : 
fern_ sim/ 
上 一 Cargo.toml 
STC/ 
上 一 main.rs 
一 spores.rs 
plant structures/ 
上 一 mod.rs 
上 一 leaves.rs 


一 roots.rs 
-一 stems.rs 































































































在 main.rs 中 声明 plant_structures 模块 : 
pub mod plant_structures; 
这 样 Rust 就 会 去 加 载 plant_structures/mod.rs， 而 在 这 个 文件 中 ， 又 会 声明 3 个 子 模块 : 


// 在 plant_structures/mod.rs 中 
pub mod roots; 
pub mod stems; 
pub mod leaves; 


这 3 个 模块 的 内 容 保存 在 名 为 leaves.rs、roots.rs 和 stems.rs 的 单独 文件 中 ， 与 mod.rs 一 起 
位 于 plant_structrues 目录 下 。 
8.2.2 ”路 径 和 导入 


操作 符 :: 用 于 访问 模块 的 特性 。 项 目 中 任何 地 方 的 代码 都 可 以 通过 写 出 其 绝对 路 径 来 引 
用 标准 库 特 性 : 
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if s1 > S2 
::std::mem::Sswap(&mut s1，&mut s2); 

} 
函数 名 ::std: :mem: :swap 是 一 个 绝对 路 径 ， 因 为 它 以 双 冒 号 开头 。 路径 ::std 引用 标准 库 
的 顶级 模块 ， 而 : :std: :mem 引用 标准 库 的 子 模块 ， 相 应 地 ，: :std: :mem: :swap 则 引用 该 模 
块 中 的 一 个 公有 函数 。 
如 果 想 写 个 圆 或 字典 ， 可 以 写 ::std::f64::consts::PI 或 ::std::collections::HashMap: :new。 
但 每 次 都 这 么 写 既 单调 乏味 ， 也 不 好 认 读 。 这 时 候 可 以 把 要 使 用 的 特性 导入 模块 中 : 


Use std: :mem; 














if sl1 > S2{ 
mem: :swap(&mut s1，&mut s2); 


上 
这 里 的 use 声明 会 让 men 在 整个 代码 块 或 者 整个 模块 中 成 为 ::std: :men 的 一 个 局 部 别名 。 
而 use 声明 中 的 路 径 会 自动 转换 成 绝对 路 径 ， 因 此 不 需要 写 出 前 导 的 ::。 
可 以 用 user std: :men: :swap; 声明 来 导入 swap 函数 本 身 ， 而 不 是 mem 模块 。 然 而 ， 上 面 的 
导入 方式 通常 被 认为 是 最 佳 方式 : 导入 类 型 、 特 性 和 模块 (如 std: :mem) ， 然 后 再 使 用 相 
对 路 径 访问 其 中 的 国 数 、 稼 量 及 其 他 成 员 。 
可 以 一 次 性 导入 多 个 名 字 : 

use std: :coLLections::{HashMap，HashSet}; // 同时 导入 两 个 模块 















































use std::io::prelude::*; // 导入 所 有 模块 
以 上 代码 是 对 以 下 代码 的 简写 : 


use std::collections::HashMap; 
use std::collections::HashSet; 





// std: :io::preLude 中 的 所 有 公有 特性 项 : 
use std::io::prelude::Read; 

use std::io::preLude: :Write; 

use std::io::prelude::BufRead; 

use std::io::prelude::Seek; 


模块 不 会 自动 从 自己 的 父 模块 继承 名 字 。 比 如 ， 假 设 在 一 个 父 模块 proteins/mod.rs 中 有 如 
下 声明 : 


// proteins/mod.rs 
pub enum AminoAcid { ... } 
pub mod synthesis; 


然后 其 子 模块 synthesis.rs 中 的 代码 不 会 自动 看 到 类 型 AninoAcid: 


// proteins/synthesis.rs 
pub fn synthesize(seq: &[AminoAcid]) // 错误 : 找 不 到 类 型 AminoAcid 

















实际 上 ， 每 个 “白手 起 家 ”的 模块 都 必须 导入 自己 要 使 用 的 名 字 : 
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// proteins/synthesis.rs 
use super::AminoAcid; // 从 父 模 块 中 明确 导入 


pub fn synthesize(seq: &[AminoAcid]) // 可 以 


关键 字 super 在 导入 声明 中 有 特殊 含义 : 它 是 父 模 块 的 一 个 别名 。 类 似 地 ，self 则 是 当前 
模块 的 一 个 别名 。 


// in proteins/mod.rs 





// 从 一 个 子 模块 中 导入 


use self::synthesis::synthesize; 





// 从 一 个 枚 举 中 导入 名 字 ， 

// 这 样 就 可 以 用 Lys 而 不 是 AminoAcid: :Lys 来 表示 赖 氨 酸 

use self::AminoAcid::*; 
虽然 导入 声明 中 的 路 径 默认 被 当成 绝对 路 径 ， 但 使 用 self 和 super 可 以 改变 配置 ， 实 现 从 
相对 路 径 导 入 。 
(当然 ， 这 里 AminoAcid 的 例子 确实 违背 了 前 面 提 到 的 只 导入 类 型 、 特 型 和 模块 的 代码 编写 
风格 。 假 如 程序 中 包含 很 长 的 氨基 酸 序列 ， 那 么 就 可 以 适用 奥 威 尔 第 六 法 则 :“ 当 必须 避 
免 说 出 粗 吕 的 话 时 ， 应 打破 这 些 法 则 。”) 
子 模块 可 以 访问 其 父 模 块 中 的 私有 特性 项 ， 但 必须 通过 名 字 导 入 每 一 项 。 使 用 super::*; 
只 会 导入 那些 被 标记 为 pub 的 特性 项 。 
模块 与 文件 不 是 一 码 事 ， 但 Unix 文件 系统 的 文件 和 目录 结构 与 模块 具有 天 然 的 对 应 关 
系 。use 关键 字 创建 别名 ， 就 像 tn 命令 创建 链接 一 样 。 路 径 跟 文 件 名 一 样 ， 有 绝对 和 相对 
两 种 形式 。self 和 super 与 特殊 目录 . 和 .. 类 似 。 把 另 一 个 包 的 根 模块 移植 到 项 目 中 的 
extern crate， 则 很 像 是 挂 载 一 个 文件 系统 。 


8.2.3 标准 前 置 模块 
前 面 刚 刚 讨 论 导 入 名 字 的 时 候 提 到 了 每 个 “白手 起 家 ”的 模块 。 实 际 上 ， 这 些 模块 并 非 那 
Pe 
首先 ， 标准 库 std 会 自动 链接 到 每 个 项 目 。 这 就 像 lib.rs 或 main.rs 中 包含 了 一 个 引用 它 的 
不 可 见 的 声明 : 

extern crate std; 
其 次 ， 一 些 特 别 常用 的 名 字 (比如 vec 和 Result) 都 包含 在 标准 前 奏 里 ， 会 被 自动 导入 。 
Rust 就 好 像 每 个 模块 (包括 根 模块 )， 都 会 以 下 面 的 导入 声明 开始 : 

use std::prelude: :v1::*; 
这 个 标准 的 前 置 模块 (prelude) 中 包含 了 几 十 个 常用 的 特 型 和 类 型 。 但 不 包含 std。 因 此 
如 果 模 块 引 用 std， 则 必须 明确 导入 它 ， 就 像 下 面 这 样 : 


use std; 















































一 般 来 说 ， 导 入 正在 使 用 的 std 的 特定 功能 会 更 有 意义 。 

第 2 章 曾 提 到 过 ， 库 有 时 候 会 提供 名 为 preLude 的 模块 。 但 std: :prelude::v1 是 唯一 会 自 
动 导 入 的 前 置 模块 。 将 一 个 模块 命名 为 prelude 只 不 过 是 一 个 约定 ， 意 在 告诉 用 户 这 个 模 
块 应 该 使 用 * 导入 。 


8.2.4 特性 项 ，Rust 的 基础 
模块 由 特性 项 构成 。 而 特性 项 也 分 很 多 种 ， 下 面 列 出 的 只 是 这 门 语言 中 主要 的 特性 : 
口 函数 
我 们 已 经 看 到 很 多 了 。 
口 类 型 

用 户 定义 类 型 通过 struct、enum 和 trait 关键 字 定义 。 本 书 会 为 它们 各 自 开辟 一 章 的 

篇 幅 ， 大 家 很 快 就 能 看 到 。 一 个 简单 的 结构 体 看 起 来 是 这 样 的 : 

pub struct Fern { 
pub roots: RootSet, 


pub stems: StemSet 


} 
结构 体 的 字段 ， 即 便 是 私有 字段 ， 也 可 以 在 声明 结构 体 的 模块 中 的 任意 位 置 访问 到 。 在 
模块 外 部 ， 则 只 有 公有 字段 可 以 访问 到 。 
事实 证 明 ， 通 过 模块 进行 访问 控制 而 不 是 像 Java 或 C++ 中 通过 类 来 实现 ， 对 软件 设计 
而 言 出 人 意料 地 有 用 。 它 不 仅 可 以 避免 繁复 的 “getter” 和 “setter” 方 法 ,很 大 程度 上 
还 消除 了 类 似 C++ 中 friend 这 样 的 声明 。 一 个 模块 可 以 定义 多 个 紧密 协作 的 类 型 ， 比 
如 frond::LeafMap 和 frond::LeafMapIter， 它 们 可 以 随时 相互 访问 各 自 的 私有 字段 ， 同 
时 又 可 以 对 程序 的 其 他 部 分 隐藏 相应 的 实现 细 市 。 

口 类 型 别名 

前 面 看 到 过 ，type 关键 字 可 以 像 C++ 中 的 typedef 那样 使 用 ， 为 现 有 类 型 声明 一 个 新 
名 字 : 

type Table = HashMap<String, Vec<String>>; 
这 里 声明 的 类 型 Table 就 是 这 个 特定 的 HashMap 的 简写 。 


fn show(table: &Table) { 






































} 
口 impl 块 
方法 通过 impl 块 添加 到 类 型 上 : 
impl Cell { 
pub fn distance_ from origin(&self) -> f64 { 
f64::hypot(self.x, self.y) 


} 
; 
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这 个 语法 将 在 第 9 章 进 行 解释 。 不 能 将 impl 块 标记 为 pub， 要 标记 ， 必 须 标 记 个 别 的 
方法 ， 以 便 让 它们 在 当前 模块 外 部 可 见 。 
私有 方法 ， 类 似 私 有 的 结构 体 字 段 ， 在 声明 它们 的 模块 的 任何 位 置 都 是 可 见 的 。 
口 常量 
const 关键 字 定 义 常 量 。 这 个 语法 与 Let 的 区 别 在 于 ， 它 可 以 标记 为 pub， 而 且 必 须 写 
明 类 型 。 同 样 ， 像 UPPERCASE_NAMES 这 样 全 部 使 用 大 写字 母 也 是 常量 命名 的 惯例 : 
pub const ROOM TEMPERATURE: f64 = 20.0; // 摄氏 度 
static 关键 字 定 义 静 态 特 性 项 ， 跟 常量 差 不 大 多 : 
pub static ROOM_TEMPERATURE: f64 = 68.0; // 华氏 度 
常量 有 点 类 似 C++ 的 #define， 即 它 的 值 会 编译 到 代码 中 使 用 它 的 每 个 地 方 。 静 态 变量 则 
是 在 程序 运行 前 就 已 经 存在 且 会 持续 存在 直到 程序 退出 的 值 。 常 量 在 代码 中 通常 用 于 保存 
魔法 数值 和 字符 串 。 静 态 变量 则 用 于 保存 大 量 数据 ， 或 者 用 于 借用 对 常量 值 的 引用 。 
没有 可 修改 (mut) 的 常量 。 静 态 变量 可 以 标记 为 mut， 但 正如 第 5 章 所 讨论 的 ，Rust 没 办 
法 保证 对 可 修改 静态 变量 的 专 有 访问 权 。 因 此 ， 可 修改 静态 变量 本 质 上 不 是 线程 安全 的 ， 
绝 不 能 在 安全 代码 中 使 用 : 


static mut PACKETS_SERVED: usize = 0; 















































println!("{} served"，PACKETS_SERVED); // 错误 : 使 用 可 修改 静态 变量 
Rust 不 提倡 使 用 全 局 可 修改 状态 。 至 于 用 什么 替代 ， 参 见 19.3.11 节 关 于 “全 局 变量 ”的 
讨论 。 
口 模块 
关于 模块 已 经 说 了 不 少 了 。 如 前 所 见 ， 模 块 可 以 包含 子 模块 ， 而 且 跟 其 他 有 名 字 的 特性 
项 一 样 ， 模 块 可 以 是 公有 的 也 可 以 是 私有 的 。 
口 导入 
use 和 extern crate 声明 也 是 特性 项 。 即 使 它们 只 是 别名 ， 也 可 以 是 公有 的 : 


// 在 plant_structures/mod.rs 中 














pub use self::leaves::Leaf; 
pub use self::roots::Root; 


这 意味 着 Leaf 和 Root 是 plant_structures 模块 的 公有 特性 项 。 同 时 ， 它 们 还 是 plant_ 
structures::Leaves::Leaf 和 plant_structrues::roots::Root 的 简化 别名 。 
标准 前 置 模块 就 是 像 这 样 写成 了 一 系列 的 pub 导入 来 定义 的 。 

口 extern 块 
extern 块 用 于 声明 用 其 他 语言 (通常 是 C 或 C++) 编写 的 函数 集合 ， 以 便 Rust 代码 可 
以 调用 它们 。 第 21 章 将 介绍 extern 块 。 











对 于 声明 了 却 没有 使 用 的 特性 项 ，Rust 会 给 出 警告 : 


warning: function is never used: ‘is square. 
--> src/crates_unused_items.rs:23:9 


/ pub fn is_ square(root: &Root) -> bool { 

| root.cross_section_shape().is_square() 
| 
| 


这 里 的 警告 可 能 会 令 人 费解 ， 因 为 存在 两 种 非常 不 一 样 的 可 能 。 一 是 这 个 函数 在 此 时 此 刻 
的 确 是 死 代码 ， 二 是 你 本 来 打算 在 其 他 包 里 使 用 它 。 如 果 是 后 一 种 可 能 ， 则 需要 将 这 个 函 
数 乃 至 整个 包含 模块 都 标记 为 公有 。 


8.3 ”将 程序 作为 库 发 布 


随 着 藤 类 植物 模拟 程序 的 开工 ， 你 会 发 现 自己 需要 更 多 程序 。 假 设 现 在 已 经 有 了 一 个 命令 
行程 序 ， 其 可 以 运行 模拟 并 把 结果 保存 到 一 个 文件 中 。 现 在 ， 你 想 再 写 几 个 程序 ， 用 于 对 
保存 在 文件 中 的 结果 进行 科学 分 析 、 以 3D 形式 实时 显示 植物 生成 过 程 ， 以 及 渲染 超 写实 
的 照 请， 等 等 。 所 有 这 些 程序 都 需要 共享 基本 的 蕨 类 植物 模拟 代码 。 因 此 ， 你 需要 把 它 改 
成 一 个 库 。 
第 一 步 是 要 把 已 有 项 目 分 成 两 部 分 : 一 个 要 成 为 库 的 包 ， 包 含 所 有 共享 代码 ， 一 个 可 执行 
文件 ， 包 含 仅 供 已 有 的 命令 行程 序 使 用 的 代码 。 
为 示范 如 何 做 ， 让 我 们 使 用 下 面 这 个 非常 简单 的 示例 程序 : 

struct Fern { 


size: f64, 
growth_rate: f64 






































} 
impl Fern { 
/// 模拟 蕨 类 植物 一 天 的 生长 
fn grow(&mut self) { 
seLf .size *= 1.0 + self.growth_rate; 
} 
} 


/// 运行 并 模拟 指定 天 数 的 生长 状况 
fn run_simulation(fern: &mut Fern, days: usize) { 
for _ in0 .. days { 
fern.grow(); 


} 
} 
fn main () { 

Let mut fern = Fern { 
size: 1.0， 
growth_rate: 0.001 

}; 
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run_simulation(&mut fern, 1000); 
println!("final fern size: {}", fern.size); 


假设 这 个 程序 有 一 个 非常 简单 的 Cargo.toml 文件 : 


[package] 

name = "fern_sim" 

version = "0.1.0" 

authors = ["You <you@example.com>"] 


把 这 个 程序 作为 库 发 布 很 简单 ， 步 又 如 下 。 

1. 将 src/main.rs 重 命名 为 src/lib.rs。 

2. 给 src/lib.rs 中 要 成 为 库 的 公有 特性 的 项 添加 pub 关键 字 。 
3. 把 main 函数 临时 转移 到 其 他 地 方 ( 稍 后 还 会 用 到 它 )。 
此 时 的 src/lib.rs 文件 变 成 了 这 样 : 


pub struct Fern { 
size: f64, 
growth_rate: f64 





} 
impl Fern { 
/// 模拟 蕨 类 植物 一 天 的 生长 
pub fn grow(&mut self) { 
self.size *= 1.0 + self.growth_rate; 
} 
} 


/// 运行 并 模拟 指定 天 数 的 生长 状况 
pub fn run_simulation(fern: &mut Fern，days: usize) { 
for _in0 .. days { 
fern.grow(); 
} 
} 
注意 ，Cargo.toml 文件 未 作 任何 修改 。 这 是 因为 最 小 化 的 Cargo.toml 文件 可 以 让 Cargo 按 
照 默 认 配置 行事 。 默 认 情 况 下 ，cargo build 会 从 源 代 码 目录 中 查找 文件 ， 然 后 决定 如 何 
构建 。 看 到 了 src/lib.rs， 它 就 知道 要 构建 的 是 一 个 库 。 


src/lib.rs 中 的 代码 构成 了 库 的 根 模块 。 使 用 这 个 库 的 其 他 包 只 能 访问 这 个 根 模块 中 的 公有 
特性 。 


8.4 src/bin 目 录 
让 原来 的 命令 行程 序 fern_sin 再 运行 起 来 也 很 简单 ，Cargo 内 置 支持 与 作为 库 的 代码 放 在 
一 起 的 小 程序 。 


事实 上 ，Cargo 本 身 就 是 以 这 种 方式 写 的 。 它 的 大 部 分 代码 写 在 一 个 Rust 库 里 。 而 本 书 中 
随处 可 见 的 命令 行程 序 cargo 只 是 一 个 小 小 的 包装 程序 ， 所 有 重量 级 工作 实际 上 都 会 交 给 
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这 个 库 来 做 。 这 个 库 和 命令 行程 序 都 位 于 同一 个 代码 仓库 中 。 
我 们 也 可 以 将 程序 和 库 放 在 同一 份 代码 中 。 把 以 下 代码 放 到 一 个 名 为 src/bin/efern.rs 的 文 
件 中 : 


extern crate fern_sim; 
use fern_sim::{Fern, run_simulation}; 





fn main() { 
let mut fern = Fern { 
size: 1.0， 


growth_rate: 0.001 
3 
run_simulation(&mut fern, 1000); 
println!("final fern size: {}", fern.size); 


} 


这 个 main 函数 就 是 刚才 暂时 挪 走 的 那个 。 在 它 的 前 面 ， 又 加 上 了 extern crate 声明 ， 因 为 
这 个 程序 要 使 用 fern_sin 库 作 为 外 部 包 。 然 后 ， 从 这 个 库 中 导入 了 Fern 和 run_simulation。 


因为 这 个 文件 在 src/bin 目录 下 ， 所 以 Cargo 会 在 下 次 运行 cargo build 时 同时 编译 fern_ 
sin 库 和 这 个 程序 。 然 后 就 可 以 使 用 cargo run --bin efern 来 运行 efern 程序 了 。 下 面 是 
运行 它 的 输出 ， 使 用 - -verbose 可 以 看 到 Cargo 正在 运行 的 命令 : 
$ cargo build - -verbose 
Compiling fern_sim v0.1.0 (file:///.../fern_sim) 
Running ‘rustc src/lib.rs --crate-name fern_sim --crate-type lib .... 
Running ‘rustc src/bin/efern.rs --crate-name efern --crate-type bin .... 
$ cargo run --bin efern --verbose 
Fresh fern_sim vO.1.0 (file:///.../fern_sim) 


Running ‘target/debug/efern. 
final fern size: 2.7169239322355985 


同样 ， 仍 然 不 需要 对 Cargo.toml 做 任何 修改 ， 因 为 Cargo 的 默认 配置 就 是 查看 源 文件 ， 然 
后 把 事情 搞定 。Cargo 会 自动 将 src/bin 中 的 .rs 文件 作为 要 构建 的 额外 程序 。 

当然 ， 现 在 fern_sin 是 一 个 库 ， 因 此 还 有 田 一 种 选择 。 可 以 把 这 个 程序 写成 一 个 独立 的 项 
目 ， 保存 到 一 个 完全 分 开 的 目录 中 ， 然 后 在 它 的 Cargo.toml 中 将 fern_sin 作为 依赖 加 上 : 


[dependencies] 
fern_sim = { path = "../fern_sim" } 


或 许 这 就 是 你 对 即将 开发 的 其 他 羡 类 植物 模拟 程序 要 做 的 。 而 sre/bin 目录 只 适合 efern 这 
样 简单 的 程序 。 


8.5 属性 
Rust 程序 中 的 任何 特性 项 都 可 以 用 属性 (attribute) 来 修饰 。 属 性 是 Rust 中 写 给 编译 器 看 
的 各 种 指令 和 建议 的 普 适 语法 。 比 如 ， 假 设 你 收 到 了 如 下 警告 : 


libgit2.rs: warning: type “`git_revspec”shoutLd have a camel case name 
such as ‘GitRevspec’, #[warn(non_camel_case_ types)] on by default 
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但 是 ， 你 这 样 命名 是 有 原因 的 ， 所 以 希望 Rust 在 碰 到 这 个 名 字 时 “ 闭 嘴 ”。 那 么 在 相应 类 
型 上 添加 一 个 #[allow] 属性 ， 就 可 以 禁用 上 面 的 警告 : 
#[allow(non_camel_case_types)] 
pub struct git_revspec { 
} 
条 件 编译 作为 一 个 特性 也 是 使 用 属性 #[cfg] 写 出 来 的 : 
// 只 在 针对 安 卓 编译 时 包含 此 模块 
#[cfg(target_os = "android")] 
mod mobile; 
#[cfg] 的 全 部 语法 可 以 查看 Rust 参考 ， 表 8-2 列 出 了 最 常用 的 一 部 分 。 
表 8-2: 常用 的 #[cfg] 语 法 
#[cfg(...)] 选 项 何 时 启用 
test 启用 测试 (以 cargo test 或 rustc --test 编译 时 ) 
debug_assertions 让 用 调试 断言 (通常 用 于 非 优化 构建 ) 
unix 为 Unix (包括 macOS) 编译 
windows 为 Windows 编译 
target_pointer_width = "64" 针对 64 位 平台 。 另 一 个 可 能 的 值 是 "32" 
target_arch = "x86_64" 针对 x86-64 架构 。 其 他 值 还 有 : "x86"、"arm"、"aarch64"、"powerpc"、 
"powerpc64" 和 "mips" 
target_o0s = "macos" 为 macOS 编译 。 其 他 值 还 有 : "windows"、"ios"、"android"、"linux"、 
"openbsd"、"netbsd"、"dragonfly" 和 "bitrig" 
feature = "robots" 启用 用 户 定义 的 名 为 "robots" 的 特性 (以 cargo build --feature robots 
或 rustc --cfg feature='"robots"' 编 译 时 )。 特 性 在 Cargo.toml 的 
[features] 部 分 声明 
not(A) 4 不 满足 时 要 提供 一 个 函数 的 两 个 不 同 实现 ， 将 其 中 一 个 标记 为 #[cfg(X)]， 
男 一 个 标记 为 #[cfg(not(x))] 
all(4,B8) 4 和 B 都 满足 时 (等 于 &&) 
any(4A,B) 4 或 B 满 足 时 (等于) 


偶尔 ， 可 能 需要 对 函数 的 行 
制 。 





了 内 扩展 (通常 会 交 给 编译 器 去 做 的 一 项 优化 ) 进 
此 时 可 以 使 用 #[inline] 属性 : 








/// 由 于 相互 间 有 渗透 ， 调 整 两 个 相 邻 细胞 间 的 离子 级 别 


#[inline] 


fn do_osmosis(c1: &mut Cell, c2: &mut Cell) { 


} 


有 一 种 情况 是 ， 没 有 #[inline] 











但 在 另 一 个 包 里 调用 ， 那 么 Rust 就 不 会 将 其 在 行内 扩展 ， 除 
或 者 明确 标记 为 #[inline]。 


否则 ， 








一 些微 观 控 


内 扩展 就 不 会 发 生 。 如 果 国 数 或 方法 在 一 个 包 里 定义 ， 
除非 它 是 泛 型 的 (有 类 型 参数 ) 


编译 器 会 将 #[inline] 看 成 一 个 建议 。Rust 也 支持 更 激进 的 #[inLine(aLways)]， 要 
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求 每 处 调用 都 将 国 数 进行 行内 扩展 以 及 其 inLine(never)]， 要 求 永 远 不 要 行内 化 。 

有 些 属性 ， 比 如 #[cfg] 和 #[allow] ， 可 以 加 到 整个 模块 中 并 应 用 于 其 中 所 有 的 特性 。 而 另 
外 一 些 属性 ， 比 如 #[test] 和 #[inLine]， 则 只 能 添加 到 个 别 特性 项 。 作 为 一 种 普 适 语法 ， 
每 个 属性 都 是 定制 的 ， 都 有 自己 支持 的 参数 。Rust 参考 文件 详细 介绍 了 支持 的 属性 。 

要 将 属性 添加 给 整个 包 ， 需 要 在 mainrs 或 lib.rs 文件 的 顶部 、 任 何 特性 项 之 前 添加 ， 而且 
要 写 #! 而 非 #。 比 如 : 


// libgit2 sys/lib.rs 
#![allow(non_camel_case_types)] 




















pub struct git_revspec { 


} 


pub struct git_error { 

} 
这 里 的 #! 告诉 Rust 将 属性 添加 给 整个 特性 项 ， 而 不 是 其 后 面 的 个 别 特性 项 。 对 这 个 例子 

言 ，#![allow] 属性 会 添加 到 整个 Libgit2_sys 包 ， 而 不 仅仅 是 struct git_revspec。 

#! 也 可 以 出 现在 函数 、 结 构 体 等 的 内 部 ， 但 通常 只 出 现在 文件 开头 ， 用 于 给 整个 模块 或 包 
添加 属性 。 有 些 属性 始终 要 使 用 #! 语法 ， 因 为 只 能 将 它们 添加 给 整个 包 。 
比如 ，#![feature] 属性 用 于 开启 Rust 语言 和 库 的 不 安全 特性 (或 者 说 实验 性 特性 一 一 因 
此 可 能 会 有 bug 或 者 将 来 有 可 能 会 被 更 改 或 删除 ) 。 举 个 例子 ， 写 作 本 书 时 ，Rust 有 一 个 
实验 性 特性 ， 其 支持 128 位 整数 类 型 1128 和 u128。 但 由 于 这 些 类 型 是 实验 性 的 ， 因 此 要 
使 用 的 话 ， 只 能 (1) 安装 Rust 的 每 夜 构建 版 且 (2) 明确 声明 你 的 包 要 使 用 它们 : 


#![feature(i128_type)] 















































fn main() { 
// 做 我 的 数学 作业 ，Rust1 
println!("{}", 9204093811595833589_u128 * 19973810893143440503_u128); 


随 着 时 间 推 移 ，Rust 团队 会 在 茶 一 天 将 某 个 实验 性 特性 列 为 稳定 化 ， 之 后 这 个 特性 就 会 成 
为 语言 标准 的 一 部 分 。 那 时 候 ，#![feature] 属性 就 变 成 多 余 的 了 ，Rust 会 生成 一 个 警告 
来 建议 你 删除 它 。 


8.6 测试 和 文档 


正如 2.3 节 所 说 ，Rust 内 置 了 一 个 简单 的 单元 测试 框架 。 测 试 就 是 以 #[test] 属性 标记 的 
#[test] 
fn math works() { 
let x: i32 = 1; 
assert!(x.is positive()); 
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assert_eq!(x + 1, 2); 


} 
cargo test 会 运行 项 目 中 的 所 有 测试 。 


$ cargo test 
Compiling math_test vO.1.0 (file:///.../math_test) 
Running target/reLease/math_test-e31ed91ae51ebf22 


running 1 test 
test math works ... ok 


test result: ok. 1 passed; 0 failed; 0 ignored; 0 measured 
( 稍 后 还 会 讨论 关于 “文档 测试 ”的 内 容 。) 
无 论 你 的 包 是 一 个 可 执行 文件 还 是 一 个 库 ， 结 果 都 是 一 样 的 。 要 想 运 行 特 定 的 测试 ， 可 以 
给 Cargo 传人 相应 的 参数 ， 比 如 cargo test match 会 运行 其 名 字 中 包含 match 的 所 有 测试 。 


测试 中 经 常会 用 到 Rust 标准 库 中 的 两 个 宏 : assert! 和 assert_eq!。assert!(expr) 在 expr 
为 true 时 成 功 ， 否 则 ， 会 许 异 并 导致 测试 失败 。assert_eq!(v1，v2) 其 实 跟 assert!(v1 
== V2) 一样， 区 别 仅 在 于 如 果断 言 失败 ， 那 么 错误 消息 会 显示 两 个 值 。 


在 一 般 的 代码 里 可 以 使 用 这 两 个 宏 来 检查 不 变性 〈invariant) ， 但 要 注意 即使 在 发 布 构建 中 
也 会 包含 assert! 和 assert_eq!。 可 以 使 用 debug_assert! 和 debug_assert_eq!， 而 不 是 编 
写 只 在 调试 构建 中 检查 的 断言 : 


要 测试 错误 用 例 ， 可 以 给 测试 添加 #[should_panic] 属性 : 


/// 正如 上 一 章 声明 过 的 那样 ， 这 个 测试 只 在 被 零 除 导致 论 异 时 才 会 通过 
#[test] 
#[should_panic(expected="divide by zero")] 
fn test_divide by_zero_ error() { 
1 / 9; // 应 该 诈 异 ! 









































标记 为 #[test] 的 函数 会 被 有 条 件 地 编译 。 如 果 运 行 的 是 cargo test，Cargo 构建 的 结果 
中 就 会 包含 程序 、 测 试 并 启用 测试 套件 。 而 简单 的 cargo build 或 cargo build --release 
会 跳 过 测试 代码 。 这 意味 着 单元 测试 代码 可 以 与 它 测试 的 代码 待 在 一 起 ， 根 据 需 要 访问 内 
部 实现 细节 ， 同 时 又 没有 运行 时 消耗 。 不 过 ， 有 可 能 会 导致 菜 些 警 告 。 比 如 : 


fn roughly_equal(a: f64, b: f64) -> booL { 
(a - b).abs() < 1e-6 
} 


#[test] 

fn trig works() { 
use std::f64::consts::PI; 
assert!(roughly_equal(PI.sin(), 0.0)); 








} 
在 测试 构建 中 ， 一 切 如 常 。 而 在 非 测试 构建 中 ，roughly_equal 是 用 不 到 的 ， 因 此 Rust 会 


给 出 警告 





$ cargo build 
Compiling math_test vO.1.0 (file:///.../math_test) 
warning: function is never used: ‘roughly_equal. 
--> src/crates_unused_testing function.rs:7:1 


(a - b).abs() < 1e-6 


> "一 


| 
7 | / fn roughly_equal(a: f64，b: f64) -> bool { 
8 | 1 
911 

贺 医 

| 


= note: #[warn(dead_code)] on by default 


所 以 ， 实 践 中 当 测 试 多 到 需要 支持 代码 时 ， 通 行 的 做 法 是 把 它们 放 到 一 个 tests 模块 中 ， 
并 使 用 #[cfg] 属性 将 整个 模块 声明 为 仅 供 测试 使 用 : 
#[cfg(test)] // 只 在 测试 构建 时 包含 此 模块 
mod tests { 
fn roughly_equal(a: f64, b: f64) -> booL { 
(a - b).abs() < 1e-6 




















} 


#[test] 

fn trig works() { 
use std::f64::consts::PI; 
assert!(roughly_equal(PI.sin(), 0.0)); 


} 
Rust 的 测试 套件 会 通过 多 个 线程 同时 运行 多 个 测试 ， 这 也 是 Rust 代码 默认 就 能 保证 线程 安全 
的 一 个 小 小 惊喜 。( 如 果 想 禁用 多 线程 ， 要 么 每 次 只 运行 一 个 测试 ， 如 cargo test testname， 


要 么 把 RUST_TEST_THREADS 环境 变量 设置 为 1。) 这 也 就 意味 着 ， 从 技术 角度 讲 ， 第 2 章 的 曼 德 
布 洛 特 程序 并 非 该 章 第 二 个 多 线程 程序 ， 而 是 第 三 个 ! 第 一 个 是 2.3 市 运行 的 cargo test。 


8.6.1 集成 测试 

蕨 类 植物 模拟 程序 的 代码 还 在 不 断 增长 。 我 们 已 经 决定 把 所 有 核心 功能 都 转移 到 一 个 库 
里 ， 以 便 多 个 可 执行 文件 使 用 。 如 果 能 像 外 部 用 户 一 样 ， 把 fern_sim.rlib 当成 一 个 外 部 
包 ， 从 而 对 这 个 库 进 行 各 种 测试 就 好 了 。 另 外 ， 还 有 一 些 测试 需要 加 载 保存 的 二 进 制 模 
拟 结果 ， 但 把 那些 大 型 测试 文件 放 在 src 目录 里 显得 太 策 重 了 。 和 集成 测试 能 帮忙 解决 这 
两 个 问题 。 

集成 测试 是 放 在 tests 目录 中 的 .rs 文件 ，tests 目录 与 项 目的 src 目录 放 在 一 起 。 运 行 cargo 
test 时 ，Cargo 会 把 每 个 集成 测试 都 编译 成 一 个 独立 的 包 ， 并 将 其 链接 到 你 的 库 和 Rust 测 
试 套件 。 下 面 是 一 个 例子 : 


// tests/unfurl.rs - Fiddleheads unfurl in sunlight 


























extern crate fern_sim; 
use fern_sim::Terrarium; 
use std::time::Duration; 
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#[test] 

fn test fiddlehead_unfurling() { 
Let mut world = Terrarium::load("tests/unfurl_files/fiddlehead.tm"); 
assert!(world.fern(0).is furled()); 
Let one_hour = Duration::from secs(60 * 60); 
world.apply_sunlight(one_hour); 
assert!(world.fern(0).is_fully_unfurled()); 


注意 ， 集 成 测试 的 开头 包含 了 extern crate 声明 ， 因 为 它 把 fern_sim 当成 了 一 个 外 部 库 
来 用 。 集 成 测试 的 关键 在 于 它 以 外 部 包 的 眼光 来 看 待 你 的 代码 (就 像 用 户 一 样 )， 测 试 你 
的 公共 API。 


cargo test 既 运 行 单元 测试 也 运行 集成 测试 。 如 果 只 想 运 行 特 定 文件 (比如 tests/unfurl.rs) 
中 的 集成 测试 ， 可 以 使 用 命令 cargo test --test unfurl。 


8.6.2 文档 


cargo doc 命令 可 以 为 你 的 库 创建 HTML 文档 : 


$ cargo doc --no-deps --open 
Documenting fern_sim vO.1.0 (file:///.../fern_sim) 


其 中 的 --no-deps 选项 告诉 Cargo 只 为 fern_sim 自身 生成 文档 ， 不 考虑 它 依赖 的 包 。 而 
--open 选项 告诉 Cargo 生成 文档 后 就 在 浏览 器 中 打开 。 


8-2 展示 了 生成 的 HTML 文档 。Cargo 把 新 的 文档 文件 保存 到 target/doc 目录 中 。 文 档 首 
页 是 target/doc/fern_sim/index.html。 






































Click or press ‘S' to search, ’?’ for more options... 


Crate fern_sim [-] [src] 


[-]Simulate the growth of ferns, from the level of individual cells 
onup. 


Reexports 


pub use plant_structures::Fern; 


pub use simulation::Terrarium; 
Modules 


cells The simulation of biological cells, which is 
as low-level as we go. 


plant_structures Higher-level biological structures. 
simulation Overall simulation control. 


spores Fern reproduction. 











图 8-2: rustdoc 生成 的 文档 示例 
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这 些 文档 基于 库 中 的 pub 特性 以 及 它们 对 应 的 文档 注释 生成 。 本 章 已 经 展示 了 几 个 文档 注 
释 了 ， 比 如 : 


/// 模拟 通过 成 熟 分 裂 产生 抱 子 


pub fn produce_spore(factory: &mut Sporangium) -> Spore { 








} 


不 过 ，Rust 在 看 到 由 3 个 斜 杠 开头 的 注释 时 ， 会 将 其 作为 一 个 #[doc] 属性 来 看 待 。 换 句 
话说 ， 在 Rust 看 来 ， 前 面 的 代码 跟 下 面 这 段 代 码 是 一 样 的 : 


#[doc =“ 模 拟 通 过 成 熟 分 裂 产 生 孢 子 "] 


pub fn produce_spore(factory: &mut Sporangium) -> Spore { 





























} 
在 编译 或 测试 库 时 ， 这 些 属性 会 被 名 略 。 而 在 生成 文档 时 ， 公 共 特 性 的 文档 注释 就 会 包含 
在 输出 中 。 
类 似 地 ， 以 /1! 开头 的 注释 会 被 看 成 #![doc] 属性 ， 从 而 添加 到 相应 的 包含 特性 ， 通 常 是 
模块 或 包 中 。 比 如 ，fern_sim/src/Lib.rs 文件 可 能 会 以 下 面 的 注释 开头 ; 

//! 模拟 蕨 类 植物 生长 

//! 从 单个 细胞 开始 
文档 注释 的 内 容 会 被 按照 Markdown (一 种 简化 的 HTML 格式 ) 来 解析 。 星 号 用 于 表示 
* 斜体 * 和 ** 粗 体 **， 空 行 则 被 视 为 另 起 一 段 ， 等 等 。 不 过 ， 直 接 写 HTML 也 是 可 以 的 。 
文档 注释 中 的 任何 HTML 标签 也 都 原样 不 变 地 复制 到 文档 中 。 
文本 中 的 代码 可 以 用 反 引 号 code" 标记。 在 输出 中 ， 反 引号 标记 的 部 分 会 以 等 宽 代码 体 展 
示 。 代 码 段 需要 缩 进 4 个 空格 : 


/// 文档 注释 中 的 代码 块 : 
/// 


1 if everything() .works() { 
/// println!("ok"); 
/// } 


你 也 可 以 使 用 Markdown 分 隔 的 代码 块 ， 最 终 效 果 相 同 。 


/// 另 一 个 相同 的 代码 块 ， 只 是 写法 不 同 : 
/7 

Wl 

/// if everything().works() { 

pad println!("ok"); 

/// } 

/// 


不 管 代 码 块 怎么 写 ， 最 有 意思 的 是 Rust 会 将 文档 注释 中 的 代码 块 自动 转换 为 测试 。 


8.6.3 ”文档 测试 


在 运行 Rust 库 中 的 测试 时 ，Rust 会 检查 所 有 出 现在 文档 中 的 代码 是 否 可 以 运行 以 及 是 否 
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有 效 。 为 此 ，Rust 会 提取 出 注释 中 的 每 个 代码 块 ， 将 其 作为 独立 的 可 执行 包 进行 编译 ， 
将 它 链接 到 你 的 库 ， 最 后 运行 。 
下 面 是 一 个 独立 的 文档 测试 (doc-test) 的 例子 。 运 行 cargo new ranges 创建 一 个 新 项 目 ， 
把 以 下 代码 放 到 ranges/src/lib.rs 中 : 


use std::ops::Range; 


上 














/// 如 果 两 个 范围 重合 ， 就 返回 true 














T 
u 








/// 

fy assert_ eq!(ranges::overlap(0..7, 3..10), true); 

/// assert_ eq!(ranges::overlap(1..5, 101..105), false); 
/// 

/// 如 果 有 一 个 范围 为 空 ， 则 不 认为 是 重合 

/// 

J assert_ eq!(ranges::overlap(0..0, 0..10), false); 
/// 


pub fn overLap(r1: Range<usize>, r2: Range<uysize>) -> bool { 
ri.start < ri.end && r2.start < r2.end && 
ri.start < r2.end && r2.start < ri.end 


} 
文档 注释 中 的 这 两 小 段 代码 出 现在 了 cargo doc 生成 的 文档 中 ， 如 图 8-3 所 示 。 














Function ranges::overlap [-] [src] 


pub fn overLap(r1: Range<usize>, r2: Range<usize>) -> bool 
[-]Return true if two ranges overlap. 


assert_eq! (ranges::overlap(0..7, 3..10), true); 
assert_eq!(ranges::overlap(1..5, 101..105), false); 


If either range is empty, they don't count as overlapping. 


assert_eq!(ranges::overlap(0..90, 0..10), false); 











图 8-3: 文档 中 出 现 了 文档 测试 
这 两 段 代 码 也 变 成 了 两 个 单独 的 测试 : 


$ cargo test 
Compiling ranges vO.1.0 (file:///.../ranges) 


Doc-tests ranges 


running 2 tests 
test overlap 0 ... ok 





test overlap 1 ... ok 


test result: ok. 2 passed; 0 failed; 0 ignored; 0 measured 


如 果 给 Cargo 传人 --verbose 标记 ， 就 会 发 现 它 是 通过 rustdoc --test 来 运行 这 两 个 测试 


的 。 
码 ， 


Rustdoc 会 把 每 个 代码 示例 都 保存 到 一 个 独立 的 文件 中 ， 并 给 它们 加 上 相应 的 模板 代 
从 而 得 到 两 个 程序 。 下 面 是 第 一 个 : 


extern crate ranges; 
fn main() { 
assert_eq!(ranges::overlap(0..7, 3..10), true); 
assert_eq!(ranges::overlap(1..5, 101..105), false); 
} 


这 是 第 二 个 : 


extern crate ranges; 
fn main() { 

assert_eq!(ranges::overlap(0..0, 0..10), false); 
} 











如 果 这 两 个 程序 都 能 编译 并 运行 成 功 ， 视 试 就 会 通过 。 
这 两 个 代码 示例 中 都 包含 断言 ， 不 过 这 只 是 因为 在 这 种 情况 下 ， 断 言 可 以 让 文档 看 起 来 更 

















好 到 














档 9 


E 解 。 文 档 测 试 并 不 辟 励 把 所 有 测试 都 放 到 注释 中 。 相 反 ， 开 发 者 尽力 写 出 最 好 的 文 
而 Rust 会 帮 你 确保 文档 中 的 代码 示例 能 够 实际 地 编译 和 运行 。 








有 时 候 ， 就 算 很 简单 的 一 行 代码 调用 都 会 涉及 很 多 细节 。 比 如 ， 要 依赖 之 前 导入 或 编写 的 
代码 ， 而 且 这 也 是 代码 能 编译 的 必要 条 件 ， 只 是 设 有 必要 在 文档 中 展示 它们 罢了 。 要 隐藏 
代码 示例 中 的 某 些 行 ， 可 以 在 这 些 行 前 面 加 上 #， 然 后 再 加 一 个 空格 : 

















/// 让 阳光 照 过 来 ， 并 按 指定 时 间 来 运行 模拟 程序 


/// 

/// # use fern_sim::Terrarium; 

/// # use std::time::Duration; 

OA # let mut tm = Terraium: :new(); 

/// tm.apple_sunlight(Duration::from_secs(60)); 


pub fn apply_sunlight(&mut self, time: Duration) { 


} 


有 时 候 在 文档 中 展示 完整 的 示例 代码 (包括 maiin 函数 和 extern crate 声明 ) 是 很 有 必要 


的 。 




















显然 ， 如 果 这 些 代码 出 现在 了 文档 示例 中 ， 那 就 不 需要 Rustdoc 再 自动 补 全 它们 了 。 





否则 结果 将 无 法 编译 。 为 此 ，Rustdoc 会 将 包含 字符 串 fn main 的 代码 块 当 作 完 整 的 程序 ， 
不 给 它 添加 任何 代码 。 

特定 的 代码 块 可 以 禁用 测试 。 要 告诉 Rust 可 以 编译 示例 ， 但 并 不 实际 运行 它 ， 可 以 使 用 代 
码 块 定 界 符号 并 加 上 no_run 注解 : 














/// 将 本 地 结果 上 传 到 在 线 相册 
/// 


/// no_run 
/// Let mut session = fern_sim::connect(); 
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/// session.upload all(); 


1 
pub fn upload all(&mut self) { 


} 


如 有 果 代 码 不 希望 示例 被 编译 ， 那 就 把 no_run 替换 成 ignore。 如 果 代 码 块根 本 不 是 Rust 代 
码 ， 则 需要 使 用 语言 的 名 字 ， 比 如 ct+ 或 sh， 纯 文本 就 直接 用 text。rustdoc 并 不 认得 几 
百 种 编程 语言 ， 它 只 是 把 自己 不 认得 的 广 解 当成 表示 不 是 Rust 代码 块 。 这 样 也 会 禁用 文档 
测试 中 的 代码 高 亮 。 


已 一 人 

8.7 ”指定 依赖 
我 们 已 经 知道 了 一 种 告诉 Cargo 到 哪里 去 寻找 项 目 依赖 包 源 代码 的 方式 : 版 本 号 。 

image = "0.6.1" 
除 此 之 外 ， 还 有 几 种 指定 依赖 的 方式 ， 以 及 关于 使 用 哪个 版 本 还 有 一 些 细节 要 交代 ， 因 此 
本 市 就 专门 讨论 一 下 。 
首先 ， 你 可 能 想 要 使 用 没有 发 布 到 crates.io 上 的 依赖 。 为 此 ， 可 以 指定 Git 仓库 的 地 址 和 
修订 版 本 : 

image = { git = "https://github.com/Piston/image.git", rev = "528f19c" } 
这 里 这 个 包 是 开源 的 ， 托 管 在 GitHub 上 。 其 实 要 指定 托管 在 你 们 公司 网 络 上 的 私有 Git 仓 
库 地 址 ， 也 是 一 样 的 。 如 以 上 代码 所 示 ， 可 以 指定 要 使 用 哪个 rev、tag 或 branch。( 这 是 
告诉 Git 要 获取 源 代 码 的 哪 次 提交 的 所 有 方式 。) 
另 一 种 方式 是 指定 包含 依赖 包 源 代码 的 目录 : 

image = { path = "vendor/image" } 
如 果 你 们 团队 只 使 用 一 个 版 本 控制 仓库 ， 其 中 包含 几 个 依赖 包 的 源 代码 ， 或 者 包含 完整 的 
依赖 图 ， 那 这 种 方式 比较 方便 。 每 个 包 都 可 以 使 用 相对 路 径 来 指定 自己 的 依赖 。 
能 够 对 依赖 控制 到 这 么 细 粒 度 是 很 有 用 的 。 假 如 你 发 现 某 个 开源 包 不 太 合用 ， 那 可 以 先 复 
制 一 份 : 只 要 在 GitHub 上 点 一 下 “Fork”， 然 后 修改 Cargo.toml 文件 中 一 行 代码 即 可 。 接 
下 来 的 cargo build 会 立即 切换 到 你 复制 的 版 本 ， 而 不 再 使 用 官方 的 版 本 。 


8.7.1 版 本 


对 于 在 Cargo.toml 中 写 的 image = "9.6.1"，Cargo 的 解释 并 没有 那么 严格 。 它 会 使 用 与 
0.6.1 版 兼容 的 最 新 版 本 的 image。 
兼容 性 的 判断 基本 上 遵循 “语义 化 版 本 ”的 思想 。 
以 0.0 开头 的 版 本 过 于 原始 ，Cargo 不 会 假设 它 与 任何 其 他 版 本 兼容 。 
以 0x (其 中 x 不 是 0) 开头 的 版 本 ， 会 被 认为 同 其 他 以 0.x 开头 的 版 本 兼容 。 比 如 前 面 
我 们 指定 的 是 image 的 0.6.1 版 ， 而 Cargo 有 可 能 会 使 用 0.6.3 版 (如 果 有 的 话 )。( 这 并 
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不 是 “语义 化 版 本 ”对 0.x 的 标准 解读 ， 但 这 个 规则 实在 太 有 用 了 ， 无 法 割舍 。) 
。 如 果 项 目 达 到 1.0 版 , 则 只 有 新 的 主 版 本 才 会 破坏 兼容 性 。 因 此 如 果 你 指定 的 是 2.0.1 版 ， 

那么 Cargo 有 可 能 会 使 用 2.17.99 版 ， 但 绝 不 会 是 3.0 版 。 
版 本 编号 默认 是 灵活 的 ， 否 则 选择 版 本 很 快 就 会 成 为 大 问题 。 假 设 有 一 个 库 LibA， 它 使 用 
了 num = "9.1.31"， 而 另 一 个 库 LibB 使 用 的 是 num = "9.1.29"。 如 果 要 求 版 本 号 严格 匹 
配 ， 那 将 不 会 有 项 目 可 以 同时 使 用 这 两 个 库 。 因 此 允许 Cargo 使 用 任何 兼容 的 版 本 是 更 加 
实际 的 默认 选择 。 
同样 ， 不 同 项 目 对 依赖 和 版 本 也 有 不 同 需 求 。 因 此 ， 指 定 版 本 时 可 以 使 用 操作 符 ， 其 既 可 
以 指定 严格 匹配 ， 也 可 以 指定 版 本 范围 ， 如 表 8-3 所 示 。 


表 8-3: 使 用 操作 符 指定 版 本 

























































































Cargo.toml 中 的 写法 含 义 

image = "=0.10.0" 只 使 用 0.10.0 版 

image = ">=1.0.5" 使 用 1.0.5 版 或 更 高 版 本 (其 至 2.9 版 都 可 以 ， 如 果 有 的 话 ) 
image = ">1.0.5 <1.1.9" 使 用 大 于 1.0.5 但 小 于 1.1.9 的 版 本 

image = "<=2.7.10" 使 用 小 于 或 等 于 2.7.10 的 版 本 























另 一 种 指定 版 本 的 策略 是 使 用 通配符 *， 但 并 不 多 见 。 这 是 告诉 Cargo 任何 版 本 都 可 以 。 
除非 另外 一 些 Cargo.toml 文件 里 有 更 具体 的 限制 ， 否 则 Cargo 会 使 用 最 新 版 本 。 要 了 解 更 
详细 的 版 本 控制 方式 ， 可 以 参考 doc.crates.io 上 的 Cargo 文档 。 


注意 ， 版 本 兼容 性 规则 意味 着 不 能 纯粹 为 了 市 场 推广 而 任意 选择 版 本 号 。 版 本 号 真 的 有 它 
的 实际 用 途 : 它 是 包 的 维护 者 与 使 用 者 的 一 种 约定 。 如 果 你 维护 的 一 个 包 的 版 本 是 1.7， 
在 删除 了 一 个 函数 或 者 做 了 其 他 不 能 向 后 兼容 的 改动 后 ， 则 必须 要 将 版 本 号 跳 到 2.0。 如 
果 你 非 要 称 它 为 1.8， 就 意味 着 新 版 本 仍然 兼容 1.7， 结 果 用 户 可 能 会 无 法 构建 代码 。 





























8.7.2 Cargo.lock 


Cargo.toml 中 的 版 本 号 是 有 意 这 么 灵活 处 理 的 ， 但 我 们 并 不 想 让 Cargo 每 次 构建 都 升级 一 
次 依赖 版 本 。 想 象 一 下 ， 我 们 正在 紧张 地 调试 代码 ， 而 cargo build 运行 后 升级 到 了 一 个 
新 版 本 的 依赖 。 有 时 候 这 是 具有 破坏 性 的 。 调 试 过 程 中 的 任何 变更 都 应 该 避免 。 事 实 上 ， 
说 到 依赖 的 库 ， 它 的 版 本 始终 不 变 才 是 最 好 的 。 


Cargo 为 此 提供 了 内 置 机 制 以 避免 上 述 情况 发 和 后。 在 第 一 次 构建 项 目 时 ，Cargo 会 输出 一 个 
Cargo.lock 文件 ， 记 录 它 使 用 的 每 个 包 的 人 确切 版 本 号 。 后 续 构 建 都 会 参考 这 个 文件 ， 并 继 
续 使 用 相同 的 版 本 。Cargo 只 会 在 你 告诉 它 升级 时 才 升 级 ， 比 如 你 手工 修改 了 Cargo.toml 
文件 中 的 版 本 号 ， 或 者 运行 了 cargo update: 
$ cargo Update 
Updating registry “https://github.com/rust-lang/crates.io-index. 


Updating libc vO.2.7 -> vO.2.11 
Updating png vO.4.2 -> vO.4.3 

















包 和 模块 | 153 





cargo update 只 会 升级 到 与 Cargo.toml 中 指定 版 本 兼容 的 最 新 版 本 。 如 果 你 指定 的 是 
image = "0.6.1"， 而 你 想 升 级 到 0.10.0， 那 必须 在 Cargo.toml 中 修改 。 下 一 次 构建 时 ， 
Cargo 就 会 把 image 库 升 级 到 这 个 新 版 本 ， 并 把 新 版 本 号 保存 到 Cargo.lock 里 。 


前 面 的 例子 展示 了 Cargo 更 新 了 两 个 包 ， 它 们 都 托管 在 crates.io 上 。 对 于 保存 在 Git 代码 
库 的 依赖 ， 情 况 也 是 类 似 的 。 假 设 Cargo.toml 文件 中 有 如 下 依赖 ; 


image = { git = "https://github.com/Piston/image.git", branch = "master" } 


如 果 存 在 Cargo.lock 文件 ， 则 cargo buitd 不 会 从 Git 仓库 中 拉 取 新 的 变更 。 在 读 取 Cargo. 
lock 后 ，Cargo 仍然 会 沿用 上 一 次 使 用 的 修订 版 本 。 但 是 ，cargo update 会 重新 拉 取 
master 分 支 ， 因 此 下 一 次 构建 就 会 使 用 该 分 支 最 新 提交 的 代码 。 


Cargo.lock 是 自动 生成 的 ， 通 常 不 建议 手工 修改 。 但 是 ， 如 果 你 的 项 目 是 一 个 可 执行 文件 ， 
那 应 该 把 Cargo.lock 提交 到 版 本 控制 系统 。 这 样 ， 任 何 构建 你 项 目的 人 都 会 拿 到 相同 的 版 
本 。Cargo.lock 文件 的 历史 将 记录 依赖 更 新 的 过 程 。 


如 果 你 的 项 目 是 一 个 普通 的 Rust 库 ， 那 就 不 用 提交 Cargo.lock 了 ， 因 为 这 个 库 的 下 游 用 户 
会 生成 包含 自己 完整 依赖 图 版 本 信息 的 Cargo.lock 文件 ， 他 们 会 忽略 库 里 的 Cargo.lock 文 
件 。 如 果 恰 巧 你 的 项 目 是 一 个 共享 库 (例如 输出 是 .dl、.dylib 或 .so 文件 )， 没 有 这 种 下 游 
的 cargo 用 户 ， 那 就 应 该 提供 Cargo.lock。 


Cargo.toml 灵活 的 版 本 机 制 使 在 项 目 中 使 用 Rust 库 变 得 非常 方便 ， 同 时 也 能 最 大 化 利用 库 
的 兼容 性 。Cargo.lock 的 记录 可 以 确保 在 不 同 机 器 上 得 到 一 致 、 可 再 现 的 构建 。 将 这 两 个 
文件 合 在 一 起 ， 很 大 程度 上 能 够 帮 开 发 者 避免 依赖 管理 的 问题 。 


8.8 把 包 发 布 到 crates.io 
你 已 经 决定 把 你 的 茧 类 植物 模拟 座 作为 开源 软件 发 布 。 祝 次 你 | 这 一 步 很 简单 。 
首先 ， 让 Cargo 帮 你 打 个 包 : 


$ cargo package 
warning: manifest has no description, license, license-file, documentation, 
homepage or repository. See http://doc.crates.io/manifest.html#package-metadata 
for more info. 

Packaging fern_sim vO.1.0 (file:///.../fern_sim) 

Verifying fern_sim vO.1.0 (file:///.../fern_sim) 

Compiling fern_sim v0O.1.0 (file:///.../fern_sim/target/package/fern_sim-0.1.0) 































































































cargo package 命令 会 创建 一 个 文件 〈 这 里 是 target/package/fern sim-0.1.0.crate)， 其 中 包含 
库 的 所 有 源 文件 ， 以 及 Cargo.toml。 这 个 文件 就 是 你 要 上 传 到 crates.io 与 世界 共享 的 (可 
以 通过 cargo package --List 来 查看 其 中 包含 什么 文件 )。Cargo 随后 会 基于 这 个 .crate 文 
件 构建 库 ， 就 像 最 终 用 户 一 样 ， 以 确保 设 有 问题 。 

在 前 面 可 以 看 到 ，Cargo 认为 Cargo.toml 中 缺少 一 些 对 下 游 用 户 来 说 非常 重要 的 信息 ， 比 
如 你 的 代码 以 什么 许可 来 发 布 。 警 告 信 息 中 的 URL 是 很 好 的 参考 资源 ， 因 此 这 里 就 不 详 
细 解 释 了 。 简 单 来 说 ， 只 要 在 Cargo.toml 中 添加 以 下 几 行 内 容 就 可 以 消除 警告 : 


























[package] 


name = "fern_sim" 

version = "0.1.0" 

authors = ["You <you@example.com>"] 

license = "MIT" 

homepage = "https://fernsim.example.com/" 

repository = "https://gitlair.com/sporeador/fern_sim" 
documentation = "http://fernsim.example.com/docs" 
description = """ 


Fern simulation, from the cellular level up. 


在 crates.io 上 发 布 了 自己 的 包 以 后 ， 任 何 下 载 它 的 人 都 可 以 看 到 这 个 Cargo. 
toml 文件 。 因 此 ， 如 果 authors 字段 中 包含 你 不 想 对 外 公布 的 电子 邮件 地 
址 ， 那 现在 就 可 以 把 它 改 掉 。 



































此 时 还 应 该 再 萎 虑 另 一 个 问题 ， 即 你 的 Cargo.toml 文件 中 可 能 使 用 了 path 指定 其 他 包 的 位 
置 ， 参 见 8.7 市 的 “指定 依赖 ”: 

image = { path = "vendor/image" } 
对 你 和 你 的 团队 来 说 ， 这 样 可 能 没 问 题 。 但 可 想 而 知 ， 如 果 其 他 人 下 载 了 这 个 fern_sim 
库 ， 那 他 们 电脑 里 的 文件 和 目录 不 可 能 跟 你 们 一 样 。 因 此 Cargo 此 时 会 忽略 自动 下 载 的 库 
中 的 path 字段 ， 而 这 可 能 导致 构建 错误 。 不 过 解决 办 法 倒 也 简单 : 如 果 你 准备 把 库 发 布 到 
crates.io， 那 它 的 依赖 也 应 该 在 crates.io 上 。 此 时 应 该 指定 版 本 号 而 不 是 使 用 path。 


image = "0.6.1" 

如 果 你 愿意 ， 可 以 既 指 定 path (本 地 构建 时 优先 使 用 )， 也 指定 version (以 便 其 他 用 户 使 用 ) : 
image = { path = "vendor/image", version = "0.6.1" } 

当然 ， 在 这 种 情况 下 ， 必 须 确 保 二 者 是 同步 的 。 

最 后 ， 在 发 布 包 之 前 ， 必 须 先 登录 到 crates.io 并 取得 API 密 钥 。 这 一 步 很 简单 ， 只 要 有 

crates.io 的 账号 ， 在 “账号 设置 ”里 ， 就 可 以 看 到 一 个 cargo Login 命令 ， 类 似 下 面 这 个 : 
$ cargo login 5jQdV54BjLXBpUUbfIj7G9DvNL1vsWW1 

Cargo 会 把 这 个 密 钥 保 存 到 一 个 配置 文件 中 ， 注 意 这 个 API 密 钥 就 像 密 码 一 样 要 保密 。 所 

以 要 记 住 只 在 你 自己 控制 的 计算 机 中 运行 这 个 命令 。 


通过 密 钥 登录 后 ， 最 后 一 步 是 运行 cargo publish: 


















































$ cargo publish 
Updating registry ‘https://github.com/rust-lang/crates.io-index. 
Uploading fern_sim vO.1.0 (file:///.../fern_sim) 


看 到 这 个 消息 ， 就 说 明 你 的 库 已 经 加 入 了 crates.io 上 面 成 千 上 万 的 开源 库 的 行列 。 
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8.9 工作 空间 


随 着 项 目 规模 的 增 大 ， 最 终 你 可 能 会 写 出 很 多 个 包 来 。 这 些 包 并 列 存在 于 一 个 产 代码 仓 
库 中 : 


fernsoft/ 

上 一 .git/... 

上 一 人 rn_ sim/ 

上 一 Cargotoml 
上 一 Cargo.lock 
一 src/. 


target/... 
fern img/ 

上 一 Cargo.toml 
上 一 Cargo.lock 


src/... 
target/... 
fern video/ 


上 一 Cargo.toml 
| 一 Cargo.lock 
上 一 src/… 


target/... 


Cargo 会 保证 每 个 包 都 有 自己 的 构建 目录 : target， 其 中 包含 一 份 这 个 包 所 有 依赖 的 独立 构 
建 。 这 些 构建 目录 完全 是 独立 的 。 即 便 两 个 包 有 相同 的 依赖 ， 也 不 能 共享 任何 编译 后 的 代 
码 。 这 显然 有 点 浪费 。 

使 用 Cargo 工作 空间 (workspace) 可 以 节省 编译 时 间 和 磁盘 空间 。 所 谓 工作 空间 ， 就 是 共 
享 相 同 构建 目录 和 Cargo.lock 文件 的 一 组 包 。 

要 使 用 工作 空间 ， 只 需 在 存储 库 的 根 目录 下 创建 一 个 Cargotoml 文件 ， 并 把 下 面 儿 行 放 进 去 : 


[workspace] 
members = ["fern_sim", "fern_img", "fern_video"] 


其 中 fern_sinm 等 是 包含 各 自 包 的 子 目 录 的 名 称 。 然 后 ， 把 这 些 子 目 录 中 剩 下 的 Cargo.lock 
文件 和 target 目录 都 删除 。 


做 完 这 些 之 后 ， 无 论 在 任何 包 中 运行 cargo build， 都 会 自动 在 根 目录 中 创建 一 个 共享 的 
构建 目录 (这 里 就 是 fernsoft/target)， 所 有 包 共 享 。 运行 命令 cargo build --all 会 构建 当 
前 工作 空间 中 所 有 的 包 。 同 样 ，cargo test 和 cargo doc 也 都 接收 --all 选项 。 


8.10 还 有 惊喜 
如 果 这 些 还 不 足以 让 你 高 兴 ，Rust 社区 还 为 你 提供 了 一 些 好 东西 。 


当 你 在 crates.io 上 发 布 了 自己 的 开源 包 之 后 ， 你 的 文档 会 自动 发 布 到 docs.rs (感谢 
Onur Aslan ) 。 


一 一 一 一 
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。 如 果 你 的 项 目 在 GitHub 上 ，Travis CI 可 以 在 你 每 次 推送 代码 时 自动 构建 和 测试 。 设 置 
也 极其 简单 , 详细 信息 请 参考 travis-ciorg。 如 果 你 已 经 熟悉 Travis , 那 可 以 从 这 个 .travis. 
yml 开始 。 

Language: rust 


rust: 
- stable 


。 可 以 基于 包 的 顶级 文档 注释 生成 一 个 README.md 文件 。 这 个 功能 是 由 Livio Ribeiro 
开发 的 一 个 第 三 方 Cargo 插件 提供 的 。 运 行 cargo install readme 即 可 安装 这 个 插件 ， 
然后 可 以 通过 cargo readme --help 来 学 习 如 何 使 用 它 。 

当然 ， 令 人 兴奋 的 东西 还 不 止 这 些 。 

Rust 是 一 门 新 语言 ， 但 从 一 开始 设计 它 就 是 要 支持 大 型 、 重 量 级 的 项 目 。 记 今 为 止 ，Rust 

活跃 的 社区 已 经 涌现 了 一 大 批 优秀 的 工具 。 系 统 程序 员 们 也 有 很 酷 的 东西 可 以 玩 了 。 
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第 9 章 


结构 体 





很 久 以 前 ， 牧 羊 人 就 是 通过 观察 外 在 特征 是 否 满足 同 构 条 件 来 确定 两 群 羊 是 否 必 
于 同一 类 的 。 


一 一 John C. Baez, James Dolan, “Categorification” 


Rust 的 结构 体 ， 有 时 候 也 叫 结构 ， 类 似 于 C 和 C++ 中 的 struct 类 型 、Python 中 的 类 以 
及 JavaScript 中 的 对 象 。 结 构 体 把 各 种 类 型 的 值 聚集 为 一 个 值 ， 以 便 作为 一 个 整体 来 处 理 。 
给 定 一 个 结构 体 ， 我 们 可 以 读 取 或 修改 它 的 任意 组 件 。 结 构 体 也 可 以 有 关联 的 方法 ， 用 于 
操作 自己 的 组 件 。 


Rust 有 3 种 结构 体 类 型 : 命名 字段 (named-field) 结构 体 、 类 元 组 (tuple-like) 结构 体 和 
类 基 元 (unit-like) 结构 体 ， 区 别 在 于 如 何 引 用 它们 的 组 件 。 命 名 字段 结构 体 的 每 个 组 件 
都 有 一 个 名 字 ， 类 元 组 结构 体 以 组 件 出 现 的 次 序 来 标识 它们 ， 类 基 元 结构 体 则 根本 没有 组 
件 。 类 基 元 结构 体 并 不 常见 ， 但 比 我 们 想象 的 有 用 。 


本 章 将 详细 介绍 每 一 种 结构 体 ， 展 示 它 们 在 内 存 中 的 样子 。 还 将 讨论 如 何 给 它们 添加 方 
法 、 如 何 定 义 对 不 同 组 件 类 型 都 有 效 的 泛 型 结构 体 ， 以 及 如 何 让 Rust 为 结构 体 生成 常用 特 
型 (trait) 的 实现 。 


全 mm EN 
9.1 命名 字段 结构 体 
下 面 是 一 个 命名 字段 结构 体 类 型 的 定义 : 
/// 8 位 灰 阶 像素 的 矩形 


struct GrayscaleMap { 
pixels: Vec<u8>, 
size: (usize, usize) 



































} 
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这 里 声明 的 结构 体 类 型 为 GrayscateMap， 它 包含 两 个 给 定 类 型 的 字段 : pixels 和 size。 
Rust 对 所 有 类 型 (包括 结构 体 ) 的 命名 有 一 个 约定 ， 即 每 个 单词 的 首 字母 要 大 写 ， 比 如 
GrayscatLeMap， 称 为 驼峰 拼写 法 (CamelCase)。 字 段 和 方法 的 名 字 要 小 写 ， 单 词 间 以 下 划 
线 分 隔 ， 称 为 蛇 形 拼写 法 (snake_case)。 


可 以 使 用 结构 体 表达 式 (struct expression) 创建 结构 体 的 值 ， 比 如 : 


let width = 1024; 
let height = 576; 
let image = GrayscaleMap { 
pixels: vec![0; width * height], 
size: (width, height) 
}; 
结构 体 表达 式 以 类 型 名 (GrayscaleMap) 开头 ， 后 跟 一 对 花 括号 ， 其 中 列 出 了 每 个 字段 的 
名 字 和 值 。 如 果 局 部 变量 或 参数 与 字段 同名 ， 那 么 也 可 以 采用 以 下 国 数 中 的 简写 形式 : 
fn new_map(size: (usize, usize), pixels: Vec<y8>) -> GrayscaLeMap { 


assert_ eq!(pixels.len(), size.0 * size.1); 
GrayscaleMap { pixels, size } 























} 


函数 中 的 结构 体 表达 式 GrayscaleMap { pixels，size } 是 对 GrayscaleMap { pixels: 
pixels，size: size } 的 简写 。 在 同一 个 结构 体 表达 式 中 ， 可 以 同时 对 某 些 字段 使 用 key: 
value 语法 ， 而 对 另 一 些 字 段 使 用 简写 语法 。 


使 用 熟悉 的 . 操作 符 访问 结构 体 的 字段 : 


assert_eq!(image.size, (1024, 576)); 
assert_eq!(image.pixels.len(), 1024 * 576); 


与 Rust 中 的 其 他 构成 项 一 样 ， 结 构 体 默认 是 私有 的 ， 甚 只 在 声明 它 的 模块 中 可 见 。 要 想 让 
结构 体 对 模块 外 部 可 见 ， 需 要 在 它 的 定义 之 前 加 上 pub 关键 字 。 结 构 体 中 的 字段 默认 也 是 
私有 的 : 

/// 8 位 灰 阶 像素 的 矩形 

pub struct GrayscaLeMap { 


pub pixels: Vec<u8>， 
pub size: (usize, usize) 























} 
就 算 结构 体 声 明 为 公有 (pub)， 其 字段 仍然 可 以 私有 : 


/// 8 位 灰 阶 像素 的 矩形 

pub struct GrayscaLeMap { 
pixels: Vec<u8>， 
size: (usize, usize) 














3 


其 他 模块 可 以 使 用 这 个 结构 体 以 及 它 的 任何 公有 方法 ， 但 不 能 通过 名 字 访 问 其 私有 字段 ， 
也 不 能 使 用 结构 体 表达 式 创 建新 GrayscaleMap 值 ， 也 就 是 说 ， 创 建 结构 体 值 要 求 结构 体 的 
所 有 字段 都 必须 是 可 见 的 。 这 也 是 不 能 通过 结构 体 表达 式 来 创建 新 String 或 Vec 的 原因 。 
这 些 标准 类 型 都 是 结构 体 ， 但 它们 的 字段 都 是 私有 的 。 如 果 想 创建 它们 的 值 ， 则 必须 使 用 
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其 公有 方法 ， 比 如 Vec: :new()。 


创建 命名 字段 结构 体 的 值 时 ， 可 以 使 用 另 一 个 相同 类 型 的 结构 体 来 提供 省 略 的 字段 值 。 在 
结构 体 表达 式 中 ， 如 果 命 名 字段 后 面 跟着 .. EXPR， 那 么 任何 没有 出 现 的 字段 都 将 从 EXPR 
中 取得 自己 的 值 。 当 然 ， 前 提 是 EXPR 必须 为 同一 结构 体 类 型 的 另 一 个 值 。 假 设 有 下 面 这 个 
表示 游戏 中 怪物 的 结构 体 : 


struct Broom { 
name: String, 
height: u32, 
health: u32, 
position: (f32, f32, f32), 
intent: BroomIntent 








} 


/// 扫 旭 (Broom) 可 能 干 的 两 件 事 儿 
#[derive(Copy, Clone)] 
enum BroomIntent { FetchWater, DumpWater } 


2010 年 上 映 的 美国 奇幻 电影 The Sorcerer% 4pprentice (《 魔 法 师 的 学 徒 》)) 中 ， 学 徒 给 一 把 
扫 祝 施 了 魔法 ， 让 它 帮 自 己 干 活 儿 ， 可 是 活 儿 干 完了 却 不 知道 怎么 让 扫 蝇 停 下 来 。 他 用 鞠 
子 把 扫 蝇 一 砍 两 截 ， 结 果 一 把 扫 蝇 变 成 了 两 把 短 扫 蝇 ， 上 照旧 尽职 尽责 地 干 活 儿 。 


// 按 值 接收 Broom， 取 得 所 有 权 

fn chop(b: Broom) -> (Broom, Broom) { 
// 基于 b 初 始 化 broom1， 只 修改 height。 因 为 String 不 是 可 复制 类 型 ， 
// 所 以 broom1 取 得 b 名 字 的 所 有 权 
Let mut broom1 = Broom { height: b.height / 2, .. b }; 





























// 基于 broom1 初 始 化 broom2。 因 为 String 不 是 可 复制 类 型 ， 
// 所 以 必须 显 式 地 克隆 name 


Let mut broom2 = Broom { name: broomi.name.clone(), .. broom1 }; 


// 给 每 一 截 “ 怪 物 ” 扫 晕 起 个 不 一 样 的 名 字 
broomi1.name.push_str(" I"); 
broom2 .name.push_str(” II"); 


(broom1，broom2) 


} 
有 了 以 上 定义 ， 接 下 来 就 可 以 创建 一 把 扫 明 (broom)， 把 它 一 砍 两 截 ， 看 看 结果 如 何 : 


Let hokey = Broom { 
name: "Hokey" .to_string()， 
height: 60， 
health: 100， 
position: (100.0，200.0，0.0)， 
intent: BroomIntent: :FetchWater 


入 


Let (hokey1，hokey2) = chop(hokey); 
assert_eq!(hokey1.name，"Hokey I"); 
assert_eq!(hokey1.heaLth，100); 


assert_eq!(hokey2.name, "Hokey II"); 
assert_eq!(hokey2.health, 100); 





9.2 ”类 元 组 结构 体 
第 二 种 结构 体 类 型 叫 类 元 组 结构 体 ， 因 为 它 类 似 元 组 : 
struct Bounds(usize, usize); 
创建 这 种 类 型 的 值 就 像 创建 元 组 一 样 ， 只 不 过 要 加 上 结构 体 的 名 字 : 
Let image _ bounds = Bounds(1024, 768); 
类 元 组 结构 体 的 值 称 为 元 素 (element)， 跟 元 组 的 值 一 样 。 访 问 这 些 值 同样 也 跟 访问 元 组 
的 值 一 样 : 
assert_eq!(image_bounds.0 * image_bounds.1, 786432); 
类 元 组 结构 体 中 个 别 的 元 素 可 以 是 公有 的 ， 也 可 以 不 是: 
pub struct Bounds(pub usize, pub usize); 
表达 式 Bounds(1024，768) 看 起 来 像 个 函数 调用 ， 而 实际 上 也 是 。 定 义 这 种 结构 体会 隐 式 
fn Bounds(eLem0: usize, elemi1l: usize) -> Bounds { ... } 
本 质 上 ， 命 名 字段 结构 体 与 类 元 组 结构 体 非 常 相似 。 选 择 用 哪 一 种 需要 考虑 易 读 性 、 歧 义 
性 和 简洁 性 。 如 果 很 多 时 候 要 使 用 . 操作 符 取得 值 的 组 件 ， 则 名 字 标 识 的 字段 能 为 读者 提 
供 更 多 信息 ， 也 更 不 容易 写 错 。 如 果 经 常 需要 使 用 模式 匹配 来 查询 元 素 ， 那 类 元 组 结构 体 
更 合适 。 
类 元 组 结构 体 很 适合 创建 新 类 型 (newtype)， 即 只 包含 一 个 要 经 过 更 严格 类 型 检查 的 组 件 
的 结构 体 。 比 如 ， 如 果 想 只 使 用 ASCII 文本 ， 那 么 可 以 像 这 样 定义 一 个 新 类 型 ; 
struct Ascii(Vec<yu8>); 
与 传递 Vec<u8> 内 存 缓冲 区 并 通过 注释 说 明 它们 是 什么 相 比 ， 用 上 面 这 个 类 型 来 声明 ASCII 
字符 串 要 明确 得 多 。 这 个 新 类 型 可 以 帮助 Rust 发 现 错误 ， 比 如 给 一 个 接收 ASCII 文本 的 函 
数 传递 了 其 他 字 节 缓冲 区 。 第 21 章 将 介绍 一 个 使 用 新 类 型 实现 高 效 类 型 转换 的 例子 。 


9.3 ”类 基 元 结构 体 
第 三 种 结构 体 有 点 不 好 理解 ， 因 为 这 是 一 种 完全 没有 元 素 的 结构 体 : 

struct Onesuch; 
这 种 类 型 的 值 不 占 内 存 ， 非 常 像 基 元 类 型 ()。Rust 不 会 把 类 基 元 结构 体 的 值 保存 到 内 存 
里 ， 也 不 会 生成 操作 它们 的 代码 ， 因 为 通过 类 型 就 知道 它 的 值 了 。 从 逻辑 上 讲 ， 空 结构 体 
类 型 的 值 是 一 样 的 ， 或 者 更 准确 地 说 ， 这 种 类 型 都 只 有 一 个 值 : 


let o = Onesuch; 
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在 前 面 6.9 节 中 ， 我 们 曾 磁 到 过 一 个 类 基 元 结构 体 。 表 达 式 3..5 是 对 结构 体 值 Range 











{ start: 3，end; 5 } 的 简写 形式 ， 而 表达 式 .， (省略 了 两 个 端点 的 范围 


构 体 值 RangeFull 的 简写 。 
类 基 元 结构 体 在 使 用 特 型 的 时 候 也 有 用 ， 第 11 章 将 讨论 这 一 点 。 


9.4 结构 体 布局 























) 是 对 类 基 元 结 


在 内 存 中 ， 命 名 字段 结构 体 与 类 元 组 结构 体 一 样 都 是 值 的 集合 ， 类 型 可 以 不 同 ， 并 以 特定 


方式 存储 。 比 如 ， 本 章 前 面 定义 的 结构 体 GrayscaleMap: 


struct GrayscaLeMap { 
pixels: Vec<u8>, 
size: (usize, usize) 


} 





这 个 GrayscaleMap 的 值 在 内 存 中 的 布局 如 图 9-1 所 示 。 
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图 9-1: GrayscaleMap 结构 体 在 内 存 中 的 存储 方式 


与 C 和 C++ 不同 ，Rust 不 保证 结构 体 的 字段 或 元 素 在 内 存 中 会 以 某 种 顺序 存储 ， 上 面 的 








示意 图 只 展示 了 一 种 可 能 的 布局 。 不 过 ， 








Rust 保证 把 字段 的 值 直接 存储 在 结构 体 的 内 存 块 





中 。JavaScript、Python 和 Java 会 把 pixels 和 size 的 值 分 别 存储 到 各 自在 堆 内 存 上 分 配 到 
的 块 中 并 使 6rayscaleMap 字段 指向 它们 ， 而 Rust 直接 把 pixels 和 size 放 到 GrayscaLeMap 
值 的 内 存 里 ， 只 有 pixels 向 量 拥有 自己 分 配 在 堆 上 的 内 存 块 。 


可 以 使 用 #[repr(C)] 属性 要 求 Rust 以 如 


容 C 和 C++ 的 方式 在 内 存 中 存储 结构 体 。 第 21 





章 将 详细 讨论 这 一 点 。 


9.5 ”通过 impl 定 义 方法 
到 目前 为 止 ， 本 书 已 经 展示 了 在 各 种 值 上 调用 多 种 方法 的 例子 。 比 如 ， 调 用 v.push(e) 把 
元 素 推 到 向 量 里 、 调 用 v.len() 取得 向 量 的 长 度 、 调 用 r.expect("msg") 检查 Result 值 是 








不 是 包含 错误 ， 等 等 。 





可 以 给 任意 结构 体 类 型 定义 方法 。 但 与 C++ 或 Java 直接 在 结构 体 中 定义 方法 不 同 ， 在 


Rust 中 定义 方法 要 使 用 单独 的 impl 块 ， 


比如 : 
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/// 一 个 后 进 先 出 的 字符 队列 

pub struct Queue { 
older: Vec<char>， // 旧 元 素 ， 最 老 的 在 最 后 
younger: Vec<char> // 新 元 素 ， 最 新 的 在 最 后 


impl Queue { 
/// 把 一 个 字符 推 到 队列 后 端 
pub fn push(&mut self, c: char) { 
self.younger .push(c); 

















} 


/// 从 队列 前 端 取 出 一 个 字符 ， 如 果 可 以 ， 取 出 字符 返回 Some(c)， 
/// 否则 如 果 队 列 是 空 的 ， 返回 None 
pub fn pop(&mut self) -> Option<char> { 
if self.older.is empty() { 
if self.younger.is empty() { 
return None; 














3 


// 把 younger 中 的 元 素 转移 到 older 中 ， 

// 并 保持 对 外 承诺 的 顺序 

use std::mem::swap; 

swap(&mut self.older, &mut self.younger); 
self.older.reverse(); 


} 




















// 到 这 里 older 肯 定 有 元 素 。Vec 的 pop 方 法 已 经 返回 Option， 这 就 可 以 了 
self.older .pop() 


} 


implt 块 只 是 fn 定义 的 集合 ， 这 些 函 数 都 会 成 为 块 顶部 提 到 名 字 的 那个 结构 体 类 型 的 方法 。 
这 里 先 定 义 了 一 个 公有 结构 体 Queue， 接 着 又 给 它 定义 了 两 个 公有 方法 push 和 pop。 


方法 也 称 为 关联 函数 (associated funtion)， 因 为 它们 是 与 特定 类 型 关联 的 。 与 关联 函数 相 
对 的 叫 自由 函数 (free function) ， 即 不 是 作为 impl 块 中 的 构成 项 定义 的 函数 。 


Rust 作为 第 一 个 参数 传人 并 且 要 在 其 上 调用 这 个 方法 的 值 必 须 有 一 个 特殊 的 名 字 : self。 
因为 self 的 类 型 明显 就 是 impl 块 顶部 提 到 名 字 的 那个 结构 体 或 者 对 那个 结构 体 的 引 
用 ， 所 以 Rust 允许 省 略 它 的 类 型 声明 。 而 使 用 简写 的 self、&self 和 &mut self 分 别 代 表 
self: Queue、self: &Queue 和 self: &mut Queue。 如 果 你 愿意 ， 也 可 以 使 用 包含 类 型 声明 
的 完整 形式 ， 但 几乎 所 有 Rust 代码 都 会 像 上 面 一 样 使 用 简写 。 


在 前 面 的 例子 中 ，push 和 pop 方法 通过 self.older 和 self.younger 引用 Queue 的 字段 。 我 
们 知道 ， 在 C++ 和 Java 的 方法 体 中 ， 可 以 通过 非 限定 标识 符 直接 访问 “这 个 ”(this) 对 
象 的 成 员 ， 而 Rust 方法 必须 显示 使 用 self 来 引用 调用 该 方法 时 作为 上 下 文 的 那个 值 ， 这 
与 Python 方法 使 用 self 以 及 JavaScript 方法 使 用 this 的 方式 类 似 。 

由 于 push 和 pop 要 修改 Queue， 因 此 它们 的 参数 都 是 &mut seLf。 不 过 ， 调 用 方法 时 不 需 
要 借用 这 个 可 修改 的 引用 ， 因 为 普通 的 方法 调用 语法 会 自动 实现 隐 式 借用 。 有 了 以 上 方法 
定义 ， 就 可 以 像 下 面 这 样 来 使 用 Queue 了 : 












































结构 体 | 163 


Let mut q = Queue { older: Vec::new(), younger: Vec::new() }; 


q.push( 0 ); 
q.push( 1 ); 
assert_eq!(q.pop()，Some('0')); 


q.push(' c '); 
assert_eq!(q.pop(), Some('1')); 
assert eq!(q.pop(), Some(' ~')); 
assert_eq!(q.pop(), None); 











一 样 ， 因 为 push 的 self 参数 就 是 这 么 要 求 的 。 
如 果 方 法 不 需要 修改 其 seLf， 那 么 可 以 让 它 接收 一 个 共享 引用 。 比 如 : 


impl Queue { 
pub fn is empty(&self) -> bool { 
self.older.is empty() && self.younger.is empty() 




















} 
} 


同样 ， 方 法 调用 表达 式 知道 要 借用 哪 种 引用 : 


assert!(q.is empty()); 
q.push(' © ); 
assert!(!q.is_empty()); 


如 有 果 方 法 要 取得 self 的 所 有 权 ， 则 可 以 取得 self 的 值 : 


impl Queue { 
pub fn split(self) -> (Vec<char>, Vec<char>) { 
(self.older, self.younger) 
} 
} 


调用 这 个 sptit 方法 看 起 来 与 调用 其 他 方法 相似 : 


Let mut q = Queue { older: Vec::new(), younger: Vec::new() }; 


q.push('P'); 
q.push('D'); 
assert eq!(q.pop(), Some('P')); 
q.push( X' ); 


Let (older, younger) = q.split(); 
// q 现 在 是 未 初始 化 状态 

assert eq!(older, vec!['D']); 
assert_ eq!(younger, vec!['X']); 


只 要 写 q.push(...) 就 能 借用 一 个 对 q 的 可 修改 引用 ， 就 像 你 写 的 是 (&mut q).push(... 


) 


但 要 注意 ， 由 于 split 取得 了 self 的 值 ， 从 而 把 Queue 转移 出 了 q， 导 致 4 变 成 了 未 初始 
化 状态 。 正 因为 spLit 中 的 self 现在 拥有 了 这 个 队列 ， 所 以 它 才 能 把 个 别 的 向 量 转移 出 来 





并 返回 给 调用 者 。 





还 可 以 定义 根本 不 将 self 作为 参数 的 方法 。 这 样 的 方法 就 成 了 与 结构 体 类 型 本 身 而 非 该 类 








型 的 值 关联 的 函数 。 遵 循 C++ 和 Java 的 传统 ，Rust 称 这 些 方法 为 静态 方法 。 静 态 方法 通 
常用 于 定义 构造 器 函数 ， 比 如 : 
impl Queue { 
pub fn new() -> Queue { 
Queue { older: Vec::new(), younger: Vec::new() } 


} 
} 


引用 这 个 方法 的 方式 是 Queue: :new， 即 类 型 名 、 双 冒号 和 方法 名 。 如 此 一 来 ， 示 例 代码 就 
可 以 变 得 更 简洁 了 : 


Let mut q = Queue::new(); 


q.push('*'); 





把 构造 器 函数 命名 为 new 是 Rust 的 惯例 ， 前 面 已 经 见 过 的 有 Vec: :new、Box: :new、HashMap 
::new， 等 等 。 但 new 这 个 名 字 本 身 没什么 特别 的 ， 它 不 是 关键 字 。 很 多 类 型 会 使 用 其 他 名 
字 命 名 的 静态 方法 作为 构造 器 ， 比 如 Vec: :with_capacity。 


虽然 一 个 类 型 可 以 对 应 多 个 impl 块 ， 但 这 些 块 必须 全 部 位 于 定义 该 类 型 的 同一 个 Rust 包 
中 。Rust 允许 开发 者 给 其 他 类 型 附加 自己 的 方法 ,第 11 章 将 具体 介绍 。 


如 果 你 熟悉 C++ 或 Java， 可 能 会 觉得 将 类 型 与 方法 的 定义 分 开 有 点 异乎 寻常 ， 但 这 样 做 有 
以 下 几 个 好 处 。 


。 容易 找到 类 型 的 数据 成 员 。 在 一 个 很 大 的 C++ 类 定义 中 ， 可 能 需要 浏览 几 百 行 代码 的 
成 员 函 数 定义 ， 才 能 对 这 个 类 的 所 有 数据 成 员 有 个 大 致 的 了 解 。 而 在 Rust 中 ， 它 们 都 
在 一 个 地 方 。 

。 尽管 可 以 考虑 将 方法 定义 与 命名 字段 结构 体 的 语法 结合 起 来 ， 但 对 于 类 元 组 结构 体 和 
类 基 元 结构 体 而 言 就 会 显得 不 够 简洁 。 把 方法 抽取 到 impl 块 中 ， 可 以 实现 一 种 语法 兼 
顾 这 3 种 结构 体 。 事 实 上 ，Rust 也 使 用 相同 的 语法 给 非 结构 体 类 型 ， 比 如 enun 类 型 和 
i32 这 种 基本 类 型 ， 定 义 方 法 。( 正 是 由 于 所 有 类 型 都 可 以 有 方法 ， 因 此 Rust 才 很 少 使 
用 对 象 这 个 术语 ， 而 是 更 倾向 于 把 一 切 都 称 为 值 。) 
同样 的 impl 语法 也 能 轻松 地 用 于 实现 特 型 ， 第 11 章 将 探讨 这 一 块 。 


9.6 泛 型 结构 体 


前 面 对 Queue 的 定义 不 够 邻 人 人 满意。 那样 的 写法 只 能 存储 字符 ， 但 它 的 结构 或 方法 并 非 
只 能 用 于 字符 。 如 果 我 们 还 定义 了 另 一 个 结构 体 ， 用 于 存储 比如 String 值 ， 那 么 除了 用 
String 代替 char 之 外 ， 其 他 代码 可 以 都 不 改 。 但 这 不 是 在 浪费 时 间 吗 ? 

好 在 Rust 结构 体 可 以 是 泛 型 (generic) 的 ， 也 就 是 说 ， 这 种 结构 体 是 一 个 模板 ， 可 以 在 其 
中 插入 任何 类 型 。 比 如 ， 下 面 定义 的 这 个 Queue 就 可 以 存储 任何 类 型 的 值 : 


pub struct Queue<T> { 






























































结构 体 | 165 


older: Vec<T>, 
younger: Vec<T> 





可 以 把 Queue<T> 中 的 <T> 读 作 “对 于 任何 元 素 类 型 T……”。 因 此 ， 上 面 的 定义 就 可 以 翻译 
成 :“ 对 于 任意 类 型 T，Queue<T> 包含 两 个 Vec<T> 类 型 的 字段 。” 比 如 ， 对 于 Queue<string>， 
T 是 String， 此 oLder 和 younger 的 类 型 都 是 vec<String>。 而 对 于 Queue<char>，T 是 
char， 那 么 这 个 结构 体 就 跟 开 始 定义 的 专门 针对 char 的 结构 体 一 样 。 事 实 上 ，Vec 本 身 也 
是 一 个 泛 型 结构 体 ， 它 就 是 以 这 种 方式 定义 的 。 

在 泛 型 结构 体 的 定义 中 ， 位 于 尖 括 号 (<>) 中 的 “类 型 名 ” 叫 作 类 型 参数 。 与 泛 型 结构 体 
对 应 的 impl 块 类 似 如 下 所 示 : 

impL<T> Queue<T> { 


pub fn new() -> Queue<T> { 
Queue { older: Vec::new(), younger: Vec::new() } 














} 


pub fn push(&mut self, t: T) { 
seLf .younger .push(t); 
} 


pub fn is empty(&self) -> booL { 
self.older.is empty() && self.younger.is empty() 
} 


} 


第 一 行 中 的 impl<T> Queue<T> 可 以 理解 为 :“ 对 于 任意 类 型 T， 这 里 给 Queue<T> 定义 儿 个 
方法 ”。 之 后 就 可 以 在 方法 定义 中 使 用 类 型 参数 T 作为 一 种 类 型 了 。 


前 面 的 代码 中 使 用 过 Rust 简写 的 self 参数 。 这 么 一 比 ， 到 处 写 Queue<T> 则 显得 多 余 又 容 
易 让 人 分 心 。 为 此 ，impl 块 (无论 是 不 是 泛 型 ) 还 定义 了 一 个 特殊 类 型 参数 Self (注意 驼 
峰 式 拼写 的 名 字 )， 表 示 要 把 方法 添加 到 其 中 的 任意 类 型 。 这 也 是 一 种 简写 形式 。 对 前 面 
的 代码 而 言 ，Self 就 表示 Queue<T>， 因 此 可 以 让 Queue: :new 的 定义 再 简短 一 点 : 


pub fn new() -> Self { 
Queue { older: Vec::new(), younger: Vec::new() } 





























} 
可 能 读者 也 注意 到 了 ， 在 new 的 方法 体 中 ， 不 需要 在 构造 表达 式 内 写 出 类 型 参数 ， 只 写 
Queue { ... 】} 就 可 以 。Rust 的 类 型 推断 会 起 作用 既然 只 有 一 种 类 型 即 Queue<T> 适合 作 
为 该 函数 的 返回 值 ， 那 Rust 会 替 我 们 给 出 这 个 参数 。 但 是 ， 在 函数 签名 和 类 型 定义 中 仍然 
需要 给 出 类 型 参数 。Rust 不 会 推断 这 些 情况 下 的 参数 类 型 ， 相 反 ， 它 要 根据 这 些 地 方 显 式 
给 出 的 类 型 来 推断 函数 体内 的 类 型 。 
调用 静态 方法 时 ， 可 以 使 用 “极速 鱼 ” 符 号 ::<> 显示 地 提供 类 型 参数 : 


let mut q = Queue::<char>::new(); 





























但 在 实际 开发 中 ， 通 常 让 Rust 为 你 推断 就 好 了 : 


let mut q = Queue::new(); 
Let mut r = Queue::new(); 


q.push("CAD");”// 明显 是 Queue<&'static str> 
r.push(0.74);  // 明显 是 Queue<f64> 





q.push("BTC"); // 比特 币 美元 价格 ，2917 年 5 月 
r.push(2737.7); // Rust 检 测 不 出 非 理性 繁荣 


事实 上 ， 本 书 在 使 用 vec 这 个 泛 型 结构 体 时 始终 都 是 这 么 做 的 。 


不 仅 结 构 体 可 以 是 泛 型 的 ， 枚 举 类 型 也 可 以 接收 类 型 参数 ， 而 且 语 法 还 非常 相似 。 第 12 
章 将 详细 介绍 枚 举 (enum) 类 型 。 


9.7 ”市 生命 期 参数 的 结构 体 


正如 5.2.5 节 讨 论 的 ， 如 果 结 构 体 类 型 包含 引用 ， 则 必须 指定 这 些 引 用 的 生命 期 。 比 如 ， 
下 面 这 个 结构 体 可 以 包含 对 某 个 片段 (slice) 中 最 大 和 最 小 元 素 的 引用 : 
struct Extrema<'elt> { 


greatest: &'elt i32, 
least: &'elt i32 











} 
前 面 说 过 ， 可 以 把 struct Queue<T> 这 样 的 声明 理解 为 : 给 定 任意 类 型 17， 都 可 以 创建 一 个 
包含 该 类 型 的 Queue<T>。 类 似 地 ， 可 以 把 struct Extrema<'elt> 理解 为 : 给 定 任意 生命 期 
'elt， 都 可 以 创建 一 个 包含 有 具有 该 生命 期 引用 的 Extrema<'elt>。 
下 面 这 个 函数 会 检查 一 个 片段 并 返回 一 个 Extrema 值 ， 该 值 的 字段 会 引用 片段 的 元 素 : 


fn find_extrema<'s>(slice: &'s [i32]) -> Extrema<'s> { 
Let mut greatest = &sLice[0]; 
Let mut Least = &slice[0]; 








for i in 1..slice.len() { 
if slice[i] < *Least { least 
if slice[i] > *greatest { greatest 


&slice[i]; } 
&slice[i]; } 


} 


Extrema { greatest, least } 


} 


这 里 ， 由 于 find_extrema 借用 了 slice 的 元 素 ， 而 slice 的 生命 期 为 's， 因 此 返回 的 结构 
体 Extrema 也 会 使 用 's 作为 其 引用 的 生命 期 。Rust 会 推断 函数 调用 的 生命 期 参数 ， 所 以 调 
用 find_extrema 时 不 需要 指出 它们 : 

let a= [0, -3, 0, 15, 48]; 

let e = find extrema(&a); 


assert eq!(*e.least, -3); 
assert_eq!(*e.greatest, 48); 


鉴于 返回 的 类 型 经 常 使 用 与 某 个 参数 相同 的 生命 期 ，Rust 允许 在 明显 有 候选 项 时 省 略 生 命 
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期 。 为 此 ，find_extrema 的 签名 其 实 可 以 写成 下 面 这 样 ， 含 义 不 变 : 


fn find_extrema(slice: &[i32]) -> Extrema { 


} 


没 错 ， 我 们 的 意思 也 可 能 是 Extrema<'static>， 但 那 种 情况 太 少 见 了 。Rust 为 常见 情况 提 
供 简写 形式 。 


9.8 为 结构 体 类 型 派生 共有 特 型 
结构 体 可 以 很 简单 ; 
struct Point { 
x: f64, 
y: f64 
} 
然而 ， 如 果 你 打算 使 用 这 个 Point 类 型 ， 又 会 发 现 有 点 麻烦 。 根 据 定义 ，Point 不 可 以 复制 、 
不 可 以 克隆 ， 也 不 能 通过 printtn!("{:?"，point) 打印 ， 还 不 支持 == 和 != 操作 符 。 


上 述 每 个 特性 在 Rus 中 都 有 一 个 名 字 : Copy、Clone、Debug 和 PartialEq， 它 们 被 称 为 特 
型 (trait)。 第 11 章 将 探讨 如 何 手工 为 自 定义 结构 体 实现 特 型 。 但 对 于 这 些 标准 的 特 型 
(以 及 其 他 一 些 特 型 )， 是 不 需要 手工 实现 的 ， 除 非 你 需要 额外 自 定义 行为 。Rust 可 以 自动 
帮 你 实现 它们 ， 分 毫 不 差 。 为 此 ， 只 需 给 结构 体 添 加 一 个 大 derive] 属性 : 
#[derive(Copy, Clone, Debug, PartialEq)] 
struct Point { 
x: f64, 
y: f64 
} 
只 要 结构 体 的 每 个 字段 都 实现 了 这 些 特 型 ,结构 体 就 能 自动 实现 它们 。 比 如 ， 之 所 以 可 以 
让 Rust 为 Point 派生 PartialEq， 是 因为 它 的 两 个 字段 都 是 f64 类 型 的 ， 而 该 类 型 已 经 实 
现 了 PartialEq。 
Rust 也 可 以 派生 Partialord， 从 而 额外 支持 <、>、<=、>= 等 比较 操作 符 。 这 里 并 没有 这 
么 做 ， 因 为 通过 比较 两 个 点 来 看 其 中 一 个 是 不 是 “小 于 ” 另 一 个 意义 不 大 。 毕 竞 点 和 点 之 
间 没 有 事先 约定 的 次 序 。 所 以 此 处 选择 不 让 Point 值 支持 这 些 操 作 符 。 正 是 由 于 存在 类 似 
这 种 情况 ， 因 此 Rust 并 没有 自动 派生 所 有 特 型 ， 而 是 让 我 们 自己 通过 #[derive] 属性 来 指 
定 。 另 外 一 个 原因 是 实现 的 特 型 会 自动 成 为 结构 体 的 公有 特性 ， 也 就 是 说 复制 、 克 隆 等 会 
成 为 结构 体 的 公有 API， 而 这 是 需要 慎重 考虑 的 。 
第 13 章 将 详细 介绍 Rust 的 标准 特 型 ， 以 及 哪些 特 型 可 以 通过 #[derive] 属性 来 派生 。 


9.9 内 部 修改 能 力 


修改 能 力 (mutability) 与 其 他 东西 一 样 : 过 度 使 用 会 出 问题 ， 而 你 经 常 只 需要 一 小 点 就 够 
了 。 比 如 ， 你 的 仆 虫 机 器 人 控制 系统 有 一 个 中 心 化 的 结构 体 ， 叫 SpiderRobot ， 包 含 设置 
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及 IO 勾 柄 。 机 器 人 启动 时 会 创建 这 个 结构 体 ， 值 永远 不 变 : 


pub struct SpiderRobot { 
species: String, 
web_enabled: bool, 
Leg_devices: [fd::FileDesc; 8]， 


} 
这 个 机 器 人 的 每 个 主 系统 都 由 一 个 不 同 的 结构 体 把 控 ， 且 它们 都 包含 一 个 指向 SpiderRobot 
的 指针 : 
use std::rc::Rc; 
pub struct SpiderSenses { 
robot: Rc<SpiderRobot>， // <-- 指向 设置 与 1/0 的 指针 


eyes: [Camera; 32], 
motion: Accelerometer, 


} 

其 他 诸如 Web 构建、 捕食、 毒液 流 控制 之 类 的 结构 体 中 ， 也 都 包含 一 个 Rc<SpiderRobot> 
智能 指针 。 还 记得 吧 ，Rc 代表 “reference counting”( 引 用 计数 )， 而 Rc 盒子 中 的 值 始终 是 
共享 的 ， 因 此 永远 不 能 修改 。 
现在 假设 你 想 使 用 标准 的 File 类 型 在 SpiderRobot 结构 体 中 记录 一 些 信息 。 有 一 个 问题 : 
File 必须 是 mut， 所 有 向 它 写 入 信息 的 方法 都 需要 一 个 对 它 的 mut 引用 。 
类 似 的 情况 很 常见 。 这 时 候 你 需要 的 只 是 在 一 个 不 可 修改 的 值 (SpiderRobot 结构 体 ) 内 
部 有 一 个 小 小 的 可 修改 数据 (一 个 File)。 这 就 叫 作 内 部 修改 能 力 (interior mutability ) 。 
Rust 为 此 提供 了 多 种 支持 方式 ， 本 节 只 讨论 两 种 最 简单 的 类 型 ， 即 CeLL<T> 和 RefCeLL<T>， 
它们 都 在 std: :cell 模块 中 定义 。 
Cell<T> 是 只 包含 一 个 T 类 型 私有 值 的 结构 体 。Cell 唯一 特别 的 地 方 是 不 需要 对 其 自身 的 
mut 引用 ， 你 也 能 取得 或 设置 其 私有 字段 的 值 。 
。 Cell: :new(value): 创建 一 个 新 CeLL， 将 value 转移 到 其 中 。 

cell.get(): 返回 cell 中 值 的 副本 。 

cell.set(value): 把 value 保存 到 ceLL， 丢 弃 之 前 保存 的 值 。 
这 个 方法 的 self 参数 是 以 非 mut 引用 的 形式 传 入 的 : 


fn set(&self, value: T) // 注意 : 不 是 &mut self 






































当然 ， 对 于 命名 为 set 的 方法 来 说 ， 这 是 不 常见 的 。 到 目前 为 止 ，Rust 给 我 们 的 感觉 是 只 
要 修改 数据 ， 就 得 获取 mut 权限 。 但 同样 地 ， 这 个 不 同 寻 常 的 细 市 也 正 是 Cell 的 关键 所 
在 。Cell 仅仅 是 恰到好处 地 为 违背 不 可 修改 规则 提供 了 一 种 安全 的 方式 。 


Cell 还 有 其 他 一 些 方法 ， 具体 可 以 查阅 相关 文档 。 
如 果 只 是 给 SpiderRobot 添加 一 个 简单 的 计数 器 ， 那 么 用 Cell 很 方便 。 可 以 这 么 写 : 
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use std::cell::Cell; 
pub struct SpiderRobot { 
hardware_error_count: Cell<uyu32>, 


} 
然后 ， 即 使 是 SpiderRobot 的 非 mut 方法 也 可 以 通过 .get() 和 .set() 方法 读 写 这 个 u32 值 : 


impl SpiderRobot { 
/// 错误 数 加 1 
pub fn add_hardware_error(&self) { 
let n = self.hardware_error_count.get(); 
self.hardware_error_count.set(n + 1); 


} 
/// 只 要 发 生 过 硬件 错误 就 是 true 


pub fn has_hardware_errors(&seLf) -> bool { 
self.hardware_error_count.get() > 0 





} 
} 


韭 常 简单 ， 可 这 不 能 解决 我 们 记录 信息 的 问题 。cell 不 让 在 共享 的 值 上 调用 mut 方 
法 。.get() 方法 返回 Cell 中 值 的 副本 ， 因 此 T 必须 实现 Copy 特 型 。 为 了 记录 信息 ， 需 要 
一 个 可 修改 的 File， 而 File 不 可 复制 。 
此 时 正确 的 选择 是 RefCeLL。 与 CeLL<T> 类 似 ，RefCell<T> 是 只 包含 一 个 T 类 型 值 的 泛 型 类 
型 。 但 与 Cell 不 同 ，RefCell 支持 借用 它 的 T 类 型 值 的 引用 。 
。 RefCell: :new(value): 创建 一 个 新 RefCeLL， 将 value 转移 到 其 中 。 
。 ref_cell.borrow(): 返回 一 个 Ref<T>， 基 本 上 是 对 ref_cell 中 值 的 共享 引用 。 
如 果 这 个 值 已 经 被 可 修改 地 借用 了 ， 这 个 方法 会 诈 异 ， 详 细 信息 见 下 文 。 
。 ref_cell.borrow_mut(): 返回 一 个 RefMut<T>， 基 本 上 是 对 ref_cell 中 值 的 可 修改 引用 。 
如 果 这 个 值 已 经 被 借用 了 ， 这 个 方法 会 证 异 ， 详 细 信息 见 下 文 。 
同样 ，RefCell 也 有 其 他 方法 ， 可 以 查阅 相关 文档 。 
上 述 两 个 borrow 方法 之 所 以 会 话 异 ， 是 因为 你 试图 破坏 Rust 中 mut 引用 是 排他 引用 的 规 
则 。 比 如 ， 以 下 代码 会 引发 诈 异 : 


let ref_ceLL: RefCeLL<String> = RefCeLL: :new("heLLo" .to_string()); 
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Let r = ref_cell.borrow(); // 没 问 题 ， 返 回 一 个 Ref<String> 
let count = r.Len(); // 没 问 题 ， 返 回 "hello" .len() 





assert_ eq!(count, 5); 


Let mut w = ref_cell.borrow_mut(); // 许 异 : 已 经 被 借用 了 
w.push_str(" world"); 


为 避免 许 异 ， 可 以 把 这 两 次 借用 放 到 两 个 独立 的 块 中 。 这 样 ,，r 会 在 你 借用 w 之 前 被 丢弃 。 
这 跟 常规 引用 的 工作 方式 非常 相似 。 唯 一 的 不 同 是， 常规 情况 下 把 引用 保存 到 变量 ，Rust 









































过 编译 时 检查 来 确保 安全 地 使 用 它 。 如 果 检 查 失败 ， 编 译 器 会 报错 。 而 RefCell 会 通 
运行 时 检查 强制 应 用 相同 的 规则 。 因 此 如 果 你 破坏 了 规则 ， 就 会 收 到 许 异 。 


现在 可 以 在 SpiderRobot 类 型 中 使 用 RefCeLL 了 : 


pub struct SpiderRobot { 


[el 
六 1 匡 





log_file: RefCell<File>, 
} 


impl SpiderRobot { 
/// 向 日 志文 件 中 写 入 一 行 信息 
pub fn Log(&seLf，message: &str) { 
Let mut file = self.log file.borrow mut(); 
writeln!(file, "{}", message).unwrap(); 


} 








} 


变量 file 的 类 型 是 RefMut<File>， 可 以 像 使 用 Fite 的 可 修改 引用 一 样 使 用 它 。 第 18 章 将 
详细 讲解 写 入 文件 的 相关 内 容 。 

Cell 和 RefCell 很 方便 ， 就 是 调用 .get()、.set() 或 .borrow()、.borrow_mut() 稍微 麻烦 
点 ， 但 这 也 只 是 对 违背 规则 的 一 个 小 小 的 惩罚 。 有 一 个 缺点 没 那 么 明显 ， 却 很 严重 ; Cell 
和 RefCell， 以 及 包含 它们 的 任何 类 型 ， 都 不 是 线程 安全 的 。 为 此 ，Rust 不 会 同时 允许 
多 个 线程 访问 它们 。 第 19 章 在 讨论 到 “Mutex<T>”( 参 见 19.3.2 节 )、“ 原 子 类 型 ”( 参 见 
19.3.10 节 ) 和 “全 局 变量 ”( 参 见 19.3.11 节 ) 时 将 介绍 线程 安全 的 内 部 修改 能 
一 个 结构 体 ， 无 论 它 包含 命名 字段 还 是 类 元 组 形式 ， 都 是 其 他 值 的 集合 体 。 如 果 我 有 
一 个 SpiderSenses 结构 体 ， 那 就 有 了 指向 共享 SpiderRobot 结构 体 的 Rc 指针 (robot: 
Rc<SpiderRobot>)、 有 了 “眼睛 ”(eyes: [Camera; 32])、 有 了 加 速 计 (motion: Accelerometer)， 
等 等 。 因 此 结构 体 的 本 质 就 是 一 个 “和 ” 字 : 我 有 和 和 了 有 没有 一 种 构建 在 “或 ” 字 基 
础 上 的 类 型 呢 ? 换 名 话说， 如果 你 有 一 个 那 种 类 型 的 值 ， 那 么 你 或 者 有 X， 或 者 有 也 这 
样 的 类 型 也 非常 有 用 ， 而 它们 在 Rust 中 几乎 无 所 不 在 ， 下 一 章 将 讨论 这 种 类 型 。 
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第 10 章 


枚 举 与 模式 





F 要 多 少 计算 机 知识 才能 解释 为 什么 ”类 型 (sum type) 如 此 稀缺 。 
(参照 : 稀缺 的 兰 布 达 ) 





Graydon Hoare 


本 章 的 第 一 个 主题 非常 有 势力 ， 且 可 谓 源远流长 ， 它 能 迅速 帮 你 “摆平 很 多 事 ”( 有 点 
代价 )。 不 同文 化 背景 下 对 它 的 称呼 各 不 相同 ， 但 它 不 干 坏 事 。 它 是 一 种 用 户 定义 的 
数据 类 型 。 很 早 以 前 ，ML 和 Haskell 程序 员 就 叫 它 “总 和 ”(sum) 类 型 、“ 有 别 联合 ” 
(discriminated union) 或 “代数 数据 ”(algebraic data) 类 型 。Rust 称 其 为 枚 举 ， 即 enum。 
枚 举 类 型 不 仅 不 干 坏事 ， 还 很 安全 ， 它 所 要 求 的 代价 是 不 能 有 大 的 损失 。 


os C# 都 有 枚 举 ， 通 过 它 可 以 定义 一 个 你 自己 的 类 型 ， 值 是 一 组 命名 常量 。 比 如 ， 
一 个 名 为 Color 的 类 型 ， 值 为 Red、0range、YeLLow 等 。Rust 也 可 以 定义 这 样 的 枚 
举 es Rust 枚 举 还 可 以 包含 数据 ， 而 且 是 不 同类 型 的 数据 。 比 如 ，Rust 的 
ResuLt<String，io::Error> 是 一 个 枚 举 类 型 ， 它 的 值 要 么 是 一 个 包含 String 的 Ok 值 ， 
要 么 是 一 个 包含 io::Error 的 Err 值 。C++ 和 C# 无 法 定义 这 样 的 枚 举 。 它 更 像 是 C 的 
union， 但 不 同 的 是 Rust 枚 举 是 类 型 安全 的 。 
如 果 一 个 值 有 儿 种 可 能 的 结果 ， 那 使 用 枚 举 来 表示 会 比较 方便 。 使 用 枚 举 的 “代价 ”是 必 
须 保证 安全 地 访问 数据 ， 也 就 是 必须 使 用 模式 匹配 ， 这 是 本 章 后 一 半 的 主题 。 
知道 Python 中 的 解 包 (unpack) 或 JavaScript 中 的 解构 (destructure)， 自 然 就 知道 模式 了 。 
但 Rust 中 的 模式 同样 不 止 如 此 ， 它 有 点 像 能 够 匹配 任意 数据 的 正则 表达 式 。 可 以 用 模式 测 
试 某 个 值 是 否 具有 特定 格式 ， 或 者 一 次 性 把 结 构 体 或 元 组 的 多 个 字段 提取 到 本 地 变 量 中 。 
模式 还 有 一 点 跟 正则 表达 式 很 像 : 非常 简洁 ， 通 常 只 要 一 行 代码 即 可 达到 目的 。 
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10.1 枚 举 
定义 C 式 枚 举 很 简单 : 
enum Ordering { 
Less， 

Equal, 


Greater 


} 


这 里 声明 的 Ordering 类 型 包含 3 个 可 能 的 值 ， 名 为 变 体 或 构造 式 (constructor) : 
::Less、0Ordering::Equal 和 0rdering::Greater。 这 个 枚 举 是 标准 库 里 定义 的 ， 因 





在 Rust 代码 中 导入 它 ， 或 者 只 导入 枚 举 本 身 : 
use std::cmp::Ordering; 


fn compare(n: i32, m: i32) -> Ordering { 
ifn<mf{ 
Ordering::Less 
} else if n>m{ 
Ordering::Greater 
} elLse 
Ordering::Equal 
} 
} 


或 者 同时 导入 它 的 所 有 构造 式 : 


use std::cmp::Ordering; 
use std::cmp::Ordering::*; // * 用 于 导入 所 有 子 元 素 




















fn compare(n: i32, m: i32) -> Ordering { 


ifn<mf{ 
Less 

} else if n>m{ 
Greater 

} else { 
Equal 

} 


} 











一 般 认为 ， 除 非 可 以 让 代码 更 好 理解 ， 否 则 不 要 导入 构造 式 。 
要 导入 当前 模块 中 声明 的 枚 举 的 构造 式 ， 使 用 self: 





enum Pet { 
Orca, 
Giraffe, 
} 


use self::Pet::*; 





Ordering 


此 可 以 


导入 构造 式 后 ， 就 可 以 不 写 0rdering::Less 而 只 写 Less 了 ， 但 这 样 意思 就 没 那么 明确 了 。 
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在 内 存 中 ，C 式 枚 举 的 值 存储 为 整数 。 有 时 候 可 能 要 告诉 Rust 使 用 什么 整数 : 


enum HttpStatus { 
Ok = 200， 
NotModified = 304， 
NotFound = 404， 


} 
否则 ，Rust 会 替 你 从 0 开始 赋值 。 


Rust 默认 使 用 能 够 容纳 它们 的 最 小 内 置 整数 类 型 来 存储 C 式 枚 举 。 多 数 情况 下 一 个 字 节 就 
够 了 。 

use std::mem::size of; 

assert eq!(size of::<Ordering>(), 1); 

assert eq!(size of::<HttpStatus>(), 2); // 一 个 u8 装 不 下 404 
可 以 通过 在 定义 枚 举 时 添加 #[repr] 属性 来 改变 Rust 在 内 存 中 存储 枚 举 的 方式 ， 相 关 细 市 
参见 第 21 章 。 


Rust 允许 把 C 式 枚 举 值 转换 为 整数 : 


assert_eq!(HttpStatus::Ok as i32, 200); 


但 不 能 直接 把 整数 转换 为 枚 举 值 。 与 C 和 C++ 不 同 ，Rust 要 保证 枚 举 值 一 定 是 在 enum 声 
明 中 定义 的 。 不 经 验证 的 整数 类 型 到 枚 举 类 型 的 转换 无 法 保证 这 一 点 。 除 非 你 自己 写 一 个 
带 验 证 的 转换 : 


fn http_status_from uy32(n: u32) -> Option<HttpStatus> { 
match n { 
200 => Some(HttpStatus::Ok)， 
304 => Some(HttpStatus::NotModified), 
404 => Some(HttpStatus::NotFound), 











Se None 
} 
} 


或 者 使 用 enun_primitive 包 ， 其 中 有 一 个 宏 能 帮 你 自动 生成 这 种 转换 代码 
眼 结构 体 一 样 ， 编 译 器 也 能 给 枚 举 添加 类 似 = 操作 符 这 样 的 特性 ， 但 必须 使 用 #[derive] 
属性 来 声明 。 


#[derive(Copy, Clone, Debug, PartialEq)] 
enum TimeUnit { 
Seconds, Minutes, Hours, Days, Months, Years 











} 
枚 举 也 可 以 有 方法 ， 同 样 跟 结构 体 一 样 : 


impl TimeUnit { 
/// 返回 这 个 时 间 单 位 的 复数 名 词 
fn plural(self) -> &'static str { 
match seLf { 











TimeUnit: 
TimeUnit: 
TimeUnit: 
TimeUnit: 
TimeUnit: 
TimeUnit:: 


} 


:Seconds => "seconds", 
:Minutes => "minutes", 
:Hours => "hours", 
:Days => "days", 
:Months => "months", 
:Years => "years" 


/// 返回 这 个 时 间 单位 的 单数 名 词 
fn singular(self) -> &'static str { 
self.plural().trim right _ matches('s') 





} 
} 


C 式 枚 举 介绍 的 差不多 了 。Rust 枚 举 更 有 意思 的 地 方 在 于 它 能 包含 的 数据 类 型 。 


10.1.1 包含 数据 的 枚 举 
有 的 程序 需要 显示 精确 到 毫秒 的 完整 日 斯 和 时 间 ， 但 对 多 数 应 用 而 言 ， 显 示 一 个 大 致 的 近 
似 值 (比如 “两 个 月 前 ”) 对 用 户 更 友好 。 可 以 写 一 个 枚 举 来 实现 这 种 转换 : 


/// 生成 向 上 进位 的 时 间 戳 ， 让 程序 显示 “6 个 月 前 ”， 
/// 而 不 是 “20206 年 4 月 9 日 晚上 16 点 55 分 ” 


#[derive(Copy, Clone, 


enum RoughTime { 








Debug, PartialEq)] 


InThePast(TimeUnit, uy32), 


JustNow, 


InTheFuture(TimeUnit, yu32) 


3} 


这 个 枚 举 中 的 两 个 变 体 InThePast 和 InTheFuture 都 接收 参数 。 这 种 变 体 叫 元 组 变 体 
(tuple variant) 。 与 元 组 结构 体 一 样 ， 这 些 构造 式 都 是 用 于 生成 新 RoughTime 值 的 函数 。 


let four_score_and_seven_years_ago = 
RoughTime: :InThepPast(TimeUnit::Years, 4*20 + 7); 

















let three_hours_from now = 
RoughTime: :InTheFuture(TimeUnit::Hours, 3); 


enum Shape { 





Sphere { center: Point3d, radius: f32 }, 


Cuboid { corner1: 


} 


Point3d, corner2: Point3d } 


Let unit_sphere = Shape::Sphere { center: ORIGIN, radius: 1.0 }; 


总 之 ，Rust 有 3 种 枚 举 变 体 ， 分 别 对 应 上 一 章 介绍 的 3 种 结构 体 。 没 有 数据 的 变 体 对 应 类 
基 元 结构 体 。 元 组 变 体 的 写法 和 作用 与 元 组 结构 体 一 样 。 结 构 体 变 体 则 有 花 括 号 和 命名 字 


段 。 一 个 枚 举 可 以 同时 包含 所 有 这 3 种 变 体 。 
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enum ReLationshipStatus { 
Single, 
InARelationship, 
ItsComplicated(Option<String>), 
ItsExtremelyComplicated { 
car: DifferentialEquation, 
cdr: EarlyModernistPoem 


} 
} 


公有 枚 举 的 所 有 构造 式 和 字段 自动 是 公有 的 。 


10.1.2 ” 枚 举 的 内 存 布局 


在 内 存 中 ， 带 数据 的 枚 举 的 每 个 构造 式 都 需要 一 个 小 整数 标签 (tag) 和 足以 容纳 最 大 变 体 
所 有 字段 的 内 存 来 存储 。 整 数 标签 是 Rust 内 部 使 用 的 字段 ， 通 过 它 可 以 知道 是 哪个 构造 式 
创建 了 当前 的 值 ， 以 及 当前 的 值 包 含 哪些 字段 。 
截止 到 Rust 1.17，RoughTime 的 每 个 构造 式 占 用 8 个 字 节 ， 如 图 10-1 所 示 。 























1 字 节 标签 (0 表示 InThePast) 

1 字 节 表示 TimeUnit 字 段 (5 表示 Years) 
2 字 节 未 用 ( 留 空 对 齐 ) 

4 字 市 表示 u32 字 有 段 


InThepPast(Years，87) 










| 5 
1 22| [LE InTheFuture(Hours, 3) 
JustNow 
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为 方便 未 来 的 优化 ，Rust 并 未 对 枚 举 的 内 存 布局 方式 做 出 任何 承诺 。 有 些 情 况 下 可 能 存在 
比 图 10-1 更 高 效 的 存储 方式 。 正 如 本 章 后 面 会 提 到 的 ，Rust 对 某 些 枚 举 会 直接 优化 掉 标 


签字 段 。 


10.1.3 使 用 枚 举 的 富 数 据 结 构 


枚 举 也 可 以 用 来 快速 实现 类 似 树 的 数据 结构 。 比 如 ， 假 设 有 一 个 Rust 程序 需要 使 用 任意 
JSON 数据 。 在 内 存 中 ， 任 何 JSON 文档 都 可 以 用 这 个 Rust 类 型 的 值 表示 ; 


enum Json { 
Null, 
Boolean(bool), 
Number(f64) ， 

















String(String), 

Array(Vec<Json>), 

Object(Box<HashMap<String, Json>>) 
} 


以 上 Rust 代码 本 身 就 足以 说 明 这 个 数据 结构 了 ， 即 使 人 类 语言 的 表达 能 力也 很 难 超越 。 
JSON 标准 规定 了 可 以 出 现在 JSON 文档 中 的 不 同 数据 类 型 : nuLL、 布 尔 值 、 数 值 、 字 符 
串 、JSON 值 数 组 ， 以 及 以 字符 串 为 键 以 JSON 值 为 值 的 对 象 。 上 面 这 个 Json 枚 举 已 经 把 
这 些 类 型 表达 得 很 清楚 了 。 
这 不 是 一 个 假想 的 例子 。serde_json 是 crates.io 上 下 载 量 最 大 的 库 之 一 ， 作 为 一 个 实现 
Rust 结构 体 序列 化 的 库 ， 它 的 实现 中 就 包含 一 个 与 上 例 极为 相似 的 枚 举 定义 。 


用 Box 包装 HashMap 来 表示 0bject 只 是 为 了 让 所 有 Json 值 更 简洁 。 在 内 存 中 ，Json 类 型 
的 值 占 4 个 机 器 字 。String 和 vec 值 占 3 个 机 器 字 ，Rust 还 会 加 一 个 标签 字 节 。NuLL 和 
Boolean 值 用 不 了 那么 多 内 存 空间 ， 但 所 有 Json 值 的 大 小 必须 相同 。 因 此 剩余 空间 就 用 不 
上 了 。 图 10-2 给 出 了 Json 值 在 内 存 中 布局 的 一 个 例子 。 


Boolean(true) 


129.0 Number (129.0) 
buffer: capacity: length: 


加 ES a 


10-2: Json 值 在 内 存 中 的 布局 


HashMap 其 实 还 要 更 大 。 如 果 每 个 Json 值 都 萎 虑 要 容纳 它 ， 那 就 太 大 了 ， 大 概 得 8 个 机 器 
字 。 但 Box<HashMap> 只 占 1 个 机 器 字 ， 因 为 它 只 是 一 个 指向 分 配 到 堆 内 存 数 据 的 指针 。 如 
有 果 用 Box 去 封装 更 多 字段 ， 那 么 还 可 以 让 Json 更 紧凑 。 


这 里 值得 注意 的 是 Rust 实现 这 个 数据 结构 有 多 简单 。 如 果 是 C++， 那 你 可 能 要 为 此 写 一 
个 类 : 


class JSON { 
private: 
enum Tag { 
Null, Boolean, Number, String, Array, Object 
上 
union Data { 
bool boolean; 
double number; 
shared_ptr<string> str; 
shared_ptr<vector<JSON>> array; 
shared_ptr<unordered map<string, JSON>> object; 
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Data() {} 
~Data() {} 
ee 


Tag tag; 
Data data; 


public: 
bool is_nuLL() const { return tag == Null; } 
bool is boolean() const { return tag == Boolean; } 
bool get boolean() const { 
assert(is_boolean()); 
return data.boolean; 
} 
void set boolean(bool value) { 
this->~JSON(); // 清理 字符 串 / 数 组 /对 象 值 
tag = Boolean; 
data.boolean = value; 




















} 
ey 
写 了 30 行 代码 ， 还 不 能 真正 开始 干 活 儿 : 这 个 类 还 需要 构造 函数 、 析 构 函 数 和 赋值 操作 
另 一 种 思路 是 使 用 父子 类 ， a a 子 类 是 JSONBooLean、]JSONString， 等 
。 无 论 采 用 哪 种 方式 ， 操 作 完 成 以 后 ， 这 个 C++ JSON 类 库 一 定 会 包含 十 几 个 方法 。 其 


an 它 必须 先 好 好 看 看 才 行 ， 而 | 个 Rust 枚 举 仅 用 了 8 行 代码 。 


10.1.4 泛 型 枚 举 
枚 举 也 可 以 泛 型 化 。Rust 标准 库 中 最 常用 的 两 个 枚 举 类 型 都 是 泛 型 枚 举 : 











enum Option<T> { 
None ， 


Some(T) 

} 

enum Result<T, E> { 
Ok(T), 
Err(E) 

} 





我 们 对 这 两 个 类 型 已 经 非常 熟悉 了， 而 泛 型 枚 举 的 语法 跟 泛 型 结构 体 一 样 。 有 一 个 小 小 的 

细节 要 注意 ， 如 果 类 型 T 是 Box 或 其 他 智能 指针 类 型 ，Rust 就 会 省 掉 0ption<T> 的 标签 字 

段 。 因 此 0ption<Box<i32>> 在 内 存 中 只 用 1 个 机 器 字 存 储 。0 表示 None， 非 零 表 示 Some 封 

装 的 

基于 泛 型 的 数据 结构 可 以 用 容 室 几 行 代码 实现 : 
// T 类 型 值 的 有 序 集合 


enum BinaryTree<T> { 
Empty, 




















TI 








o 











NonEmpty(Box<TreeNode<T>>) 


} 


// BinaryTree 的 节点 
struct TreeNode<T> { 
element: T， 
left: BinaryTree<T>, 
right: BinaryTree<T> 


文 几 行 代码 定 义 了 一 个 BinaryTree 类 型 ， 其 可 以 存储 类 型 T 任何 数量 的 值 。 


这 两 个 简洁 的 定义 浓缩 了 大 量 信 息 ， 因 此 有 必要 逐 字 了 逐 名 地 解读 一 下 。 每 个 BinaryTree 
值 要 么 是 Empty， 要 么 是 NonEmpty。 如 果 是 Empty， 那 它 根 本 不 包含 任何 数据 。 如 果 是 
NonEmpty， 那 它 包 含 一 个 Box， 也 就 是 一 个 指向 位 于 堆 内 存 的 TreeNode 的 指针 。 


每 个 TreeNode 值 包含 一 个 实际 的 元 素 ， 以 及 另外 两 个 BinaryTree 值 。 这 意味 着 树 可 以 包 
含 子 树 ， 因 此 NonEmpty 树 可 以 包含 任意 个 后 代 节 点 。 


图 10-3 展示 了 一 个 BinaryTree<&str> 值 的 草图 。 与 0ption<Box<T>> 一 样 ，Rust 也 省 掉 了 
其 标签 字段 ， 因 此 一 个 BinaryTree 值 只 占 1 个 机 器 字 。 












element 


element element 


Jeft jeft | 


right | 


right 











图 10-3: 一 个 包含 6 个 字符 串 的 BinaryTree 


创建 这 个 树 的 任何 特定 节点 都 很 简单 


use self::BinaryTree::*; 
Let jupiter_ tree = NonEmpty(Box::new(TreeNode { 
element: "Jupiter", 
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left: Empty ， 
right: Empty 
})); 


大 一 点 的 树 可 以 基于 小 一 点 的 树 来 创建 : 


Let mars_tree = NonEmpty(Box: :new(TreeNode { 
element: "Mars", 
left: jupiter_tree, 
right: mercury_tree 


})); 
自然 ， 这 里 的 赋值 会 把 jupiter_node 和 mercury_node 的 所 有 权 和 转移 给 它们 的 新 父 节 点 。 
创建 树 的 剩余 部 分 也 一 样 。 根 节点 与 其 他 节点 没有 区 别 : 


let tree = NonEmpty(Box::new(TreeNode { 
element: "Saturn", 
left: mars_tree, 
right: Uranus_tree 


])); 
本 章 后 面 将 介绍 如 何在 BinaryTree 类 型 上 实现 一 个 add 方法 ， 到 时 候 就 可 以 这 样 写 了 : 


let mut tree = BinaryTree: :Empty; 
for planet in pLanets { 
tree.add(planet); 





























} 


不 管 具有 什么 语言 背景 ， 用 Rust 创建 类 似 BinaryTree 的 数据 结构 可 能 都 需要 练习 一 下 。 
Box 放 到 哪里 在 一 开始 可 能 没 那 么 明显 。 像 图 10-3 那样 画 出 该 数据 结构 在 内 存 中 的 布局 有 
助 于 理解 自己 的 设计 是 否 可 行 。 然 后 再 反 过 来 把 图 示 转 换 成 代码 : 每 组 矩形 代表 一 个 结构 
体 (或 元 组 )， 每 个 第 头 代 表 一 个 Box (或 其 他 智能 指针 )。 确 定 每 个 字段 的 类 型 都 要 费 点 
脑筋 ， 但 也 没 那么 难 。 而 搞 清 这 些 问 题 的 回报 就 是 能 够 掌握 自己 程序 的 内 存 用 度 。 

现在 该 说 一 说 本 章 开 头 所 提 到 的 “代价 ”了 。 枚 举 的 标签 字段 要 占用 一 点 内 存 ， 最 坏 的 情 
况 下 可 能 要 8 字 节 ， 但 这 点 内 存 通常 是 微不足道 的 。 要 说 枚 举 真 正 的 缺点 〈 如 有 果 可 以 算 缺 
点 的 话 ) ， 那 就 是 Rust 代码 不 能 无 所 顾忌 地 访问 枚 举 的 字段 ， 不 管 这 些 字 段 是 否 真正 在 值 
中 存在 : 


Let r = shape.radius;  // 错误 : shape 类 型 没有 radius 字 有 段 


访问 枚 举 数据 的 唯一 方式 是 一 种 安全 的 方式 : 使 用 模式 。 


10.2 ”模式 


回忆 一 下 本 章 前 面 定义 的 这 个 RoughTime 类 型 : 


enum RoughTime { 
InThePast(TimeUnit，Uu32) ， 
JustNow, 
InTheFuture(TimeUnit, yu32) 














































































































假设 有 一 个 RoughTime 值 ， 你 需要 把 它 显 示 在 网 页 上 。 那 必须 访问 这 个 值 中 的 TimeUnit 和 
u32 字段 。 在 Rust 中 不 能 通过 rough_time.0 和 rough_time.1 直接 访问 它们 ， 毕 竟 rough_ 
time 的 值 也 可 能 是 RoughTime: :JustNow。 那 么 ， 怎 么 把 这 些 数据 取出 来 呢 ? 


要 用 match 表达 式 : 


1 fn rough_time_to_english(rt: RoughTime) -> String { 
2 match rt { 

3 RoughTime::InThePast(units, count) => 

4 format!("{} {} ago", count, units.plural()), 
5 RoughTime: :JustNow => 

6 format!("just now"), 
了 

8 

9 

0 














RoughTime: :InTheFuture(units, count) => 
format!("{} {} from now", count, units.plural()) 


10 } 


match 匹配 模式 。 具 体 到 这 个 例子 ， 模 式 就 是 第 3、5、7 行 => 符号 前 面 的 部 分 。 匹 配 
RoughTime 值 的 模式 与 创建 RoughTime 值 使 用 的 表达 式 看 起 来 几乎 一 样 ， 这 不 是 巧合 : 表达 
式 产 出 值 ， 模 式 消费 值 ， 两 者 使 用 了 很 多 相同 的 语法 。 


我 们 来 逐步 分 析 match 表达 式 运 行 时 会 发 生 什么 。 假 设 rt 的 值 是 RoughTime: :InTheFuture 
(TimeUnit::Months，1 )。Rust 先 尝试 用 第 3 行 的 模式 匹配 它 。 如 图 10-4 所 示 ， 不 匹配 。 

















值 : RoughTime: :InTheFuture(TimeUnit::Months，1) 


\x 


模式 : RoughTime: :InThepast(units, count) 








10-4: RoughTime 值 与 模式 不 匹配 


枚 举 、 结 构 体 或 元 组 在 匹配 模式 时 ， 会 从 左 到 右 对 比 模式 的 每 个 组 件 ， 依 次 检查 当前 值 是 
否 与 之 匹配 。 如 果 不 匹配 ， 就 前 进 到 下 一 个 模式 。 


第 3 行 和 第 5 行 的 模式 都 不 匹配 。 但 第 7 行 的 模式 匹配 成 功 了 ， 如 图 10-5 所 示 。 


uk 








值 : RoughTime: :InTheFuture(TimeUnit::Months,，1) 


lv vv 


模式 : RoughTime: :InTheFuture( units, count) 











10-5: 匹配 成 功 


模式 中 包含 的 简单 标识 符 ， 比 如 units 和 count， 在 模式 后 面 的 代码 中 会 成 为 局 部 变量 。 
值 中 的 内 容 会 被 复制 或 转移 到 这 两 个 新 变量 中 。 在 此 ，Rust 把 TimeUnit: :Months 保存 到 
units 中 ,把 1 保存 到 count 中 ， 随 后 运行 第 8 行 代码 ， 返 回 字 符 串 "1 months from now"。 
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这 个 


输出 有 一 个 小 语法 问题 没有 区 分 英文 的 单 复数 。 为 此 可 以 再 给 match 添加 一 个 分 文 : 


RoughTime: :InTheFuture(unit, 1) => 
format!("a {} from now", unit.singular()), 


这 个 分 支 只 在 count 字段 恰好 等 于 1 时 匹配 ， 而 且 新 分 支 必 须 加 到 第 7 行 以 前 。 如 果 把 它 
放 在 末尾 ， 那 Rust 将 永远 不 会 运行 到 它 ， 因 为 第 7 行 的 模式 匹配 InTheFuture 的 所 有 值 。 
Rust 编译 器 对 于 这 类 错误 会 给 出 “unreachable pattern” (执行 不 到 的 模式 ) 的 警告 。 

然而 ， 即 使 是 这 个 新 代码 ，RoughTime::InTheFuture(TimeUnit::Hours，1) 仍然 有 一 个 问 
题 ， 即 结果 "a hour from now" 并 不 完全 正确 。 这 可 是 一 句 英语 。 这 个 问题 可 以 通过 给 
match 再 增加 一 个 分 支 来 解决 。 

由 这 个 例子 可 知 ， 模 式 与 枚 举 简 直 是 “天 作 之 合 "， 其 至 连 枚 举 包 含 的 数据 都 能 匹配 。 如 
此 灵活 、 强 大 的 match 表达 式 足 以 替代 C 的 switch 语句 。 

到 目前 为 止 ， 本 书 只 介绍 了 匹配 枚 举 值 的 模式 。 事 实 上 模式 比 这 要 强大 得 多 。Rust 模式 本 
身 就 是 一 门 迷 你 语言 ， 如 表 10-1 所 示 。 本 章 剩 下 的 内 容 将 主要 介绍 这 个 表 中 的 特性 。 

表 10-1: 模式 





































































































模式 类 型 示 例 说 明 
字面 量 100 匹配 确切 的 值 ，const 声明 的 名 字 也 可 以 
"name" 
范围 0 ... 100 匹配 范围 中 的 任意 值 ， 包 括 最 终 值 
a con kK 
通配符 匹配 任意 值 并 忽略 该 值 
变量 name 类 似 _-， 但 会 把 匹配 的 值 转移 或 复制 到 新 的 局 部 变量 
mut count 
ref 变量 ref field 不 转移 或 复制 匹配 的 值 ， 而 是 借用 匹配 值 的 引用 
ref mut field 
子 模式 绑 定 val @ 0 ... 99 匹配 @ 右 侧 的 模式 ， 使 用 左 侧 的 变量 名 
ref circle @ Shape: :Circte 
{..} 
枚 举 模 式 Some(value) 
None 
Pet: :Orca 
元 组 模式 (key, value) 
(r, g, b) 


结构 体 模 式 。 Color(r, g, b) 
Point { x, y } 
Card { suit: Clubs, rank: n } 


Account { id, name, .. } 
引用 &value 只 匹配 引用 值 

&(k, v) 
多 个 模式 "a | A 仅 限 match (不 能 在 let 等 中 使 用 ) 
护 具 表 达 式 x if x * x <= r2 仅 限 match (不 能 在 Let 等 中 使 用 ) 








10.2.1 模式 中 的 字面 量 、 变 量 和 通配符 


前 面 我 们 看 到 了 如 何 使 用 match 表达 式 匹 配 枚 举 ， 其 他 类 型 也 可 以 匹配 。 如 果 想 实现 C 的 
switch 语句 ， 可 以 在 match 表达 式 中 使 用 整数 值 。96、1 等 整数 值 可 以 作为 模式 使 用 : 
match meadow.count_rabbits() { 

0 => 人 // 没什么 可 说 的 

1 => println!("A rabbit is nosing around in the clover."), 

n => println!("There are {} rabbits hopping about in the meadow", nN) 








一 1 











} 


模式 9 匹配 草地 (meadow) 上 没有 兔子 。1 匹配 只 有 一 只 兔子 。 两 只 或 更 多 兔子 由 模式 n 
匹配 。n 是 一 个 变量 名 ， 匹 配 任 意 值 。 匹 配 的 值 会 被 转移 或 复制 到 一 个 新 局 部 变量 中 。 在 
这 里 ，meadow.count_rabbits() 的 值 会 被 保存 到 新 局 部 变量 n 中 ， 然 后 打印 出 来 。 


其 他 类 型 的 字面 量 也 可 以 用 作 模 式 ， 包 括 布尔 值 、 字 符 ， 甚 至 字符 串 : 


let calendar = 
match settings.get _ string("calendar") { 
"gregorian" => Calendar::Gregorian, 
"chinese" => Calendar::Chinese, 
"ethiopian" => Calendar::Ethiopian, 
other => return parse_error("calendar", other) 




















}; 


在 这 个 例子 中 ，other 作为 一 个 儿 底 模式 ， 与 上 个 例子 中 的 n 类 似 。 它 们 都 相当 于 switch 
语句 中 的 defautt 分 支 ， 用 于 匹配 不 与 任何 其 他 模式 匹配 的 值 


如 有 果 你 需要 一 个 兜 底 模 式 ， 但 又 不 在 平 匹配 的 值 ， 那 么 可 以 使 用 _ 作为 模式 ， 它 是 一 个 通 
配 符 : 


let caption = 
match photo.tagged pet() { 
Pet: :Tyrannosaur => "RRRAAAAAHHHHHH", 
Pet::Samoyed => "*dog thoughts*", 
_ => "I'm cute，Love me"” // 通用 标题 ,任何 完 物 (pet) 都 适用 











0° 


























所 


通配符 模式 匹配 任意 值 ， 但 不 保存 匹配 的 值 。 由 于 Rust 要 求 每 个 match 表达 式 都 要 处 理 所 
有 可 能 的 值 ， 因 此 通常 最 后 都 会 有 一 个 通配符 。 即 便 你 非常 确定 其 他 情况 不 会 发 生 ， 也 必 
须 至 少 加 上 一 个 后 备 的 许 异 分 支 : 


// 有 很 多 形状 (shape) ， 但 我 们 只 支持 “选择 ” 某 些 文本 ， 

// 或 者 一 个 矩形 区 域 中 的 所 有 内 容 。 不 能 选择 椭圆 或 梯形 

match document.selection() { 
Shape: :TextSpan(start, end) => paint_ text_selection(start, end), 
Shape: :Rectangle(rect) => paint_rect_selection(rect), 
_ => panic!("unexpected selection type") 


























} 


有 一 点 必须 注意 ， 即 已 有 的 变量 不 能 用 作 模 式 。 假 设 我 们 要 用 六 边 形 实现 一 个 棋 类 游戏 ， 
玩家 通过 点 击 来 走 棋 。 为 确认 点 击 有 效 ， 可 能 会 这 样 写 代码 : 
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fn check_move(current_hex: Hex, click: Point) -> game::Result<Hex> { 
match point to hex(click) { 

None => 
Err("That's not a game space."), 

Some(current_hex) => // 想 要 匹配 用 户 单 击 了 当前 的 六 边 形 (current_hex) 

/ (但 这 样 不 可 以 : 原因 见 下 面 ) 

Err("You are already there! You must click somewhere else."), 

Some(other_hex) => 
Ok(other_hex) 




















} 


但 这 样 写 不 行 因为 模式 中 的 标识 符 会 引入 新 变量 。 这 里 的 模式 Some(current_hex) 会 创 
量 current_hex， 它 会 遮 住 参 数 current_hex。Rust 会 对 这 行 代码 发 出 几 个 警 
告 ， 其 中 最 主要 的 是 match 的 最 后 一 个 分 支 无 法 运行 到 。 要 解决 问题 ， 可 以 使 用 一 个 if 表 




















达 式 : 


Some(hex) => 
if hex == CuUrrent_hex { 
Err("You are already there! You must click somewhere else") 
} elsef 
Ok(hex) 
} 


稍 后 还 会 讨论 到 护 具 (guard)， 也 可 以 用 它 来 解决 这 个 问题 。 


10.2.2 元 组 与 结构 体 模式 
元 组 模式 匹配 元 组 ， 适 合 在 一 个 match 表达 式 中 同时 匹配 多 个 数据 : 


fn describe point(x: i32, y: i32) -> &'static str { 

use std::cmp::Ordering::*; 

match (x.cmp(&0), y.cmp(&0)) { 
(Equal, Equal) => "at the origin", 
(_, Equal) => "on the x axis", 
(Equal, _) => "on the y axis", 
(Greater, Greater) => "in the first quadrant", 
(Less, Greater) => "in the second quadrant", 
_ => "somewhere else" 














} 
结构 体 模式 使 用 花 括 号 ， 类 似 结构 体 表达 式 ， 其 中 每 个 字段 都 是 一 个 子 模式 : 


match baLLoon.Location { 
Point { x: 0, y: height } => 
println!("straight up {} meters", height), 
Point { x: x, y: y } => 
println!("at ({}m, {}m)", x, y) 
} 


在 这 个 例子 中 ， 如 果 第 一 个 分 支 匹配 ， 那 么 balloon. location.y 就 会 被 存储 在 新 局 部 变 
height 中 。 





PPR 是 


2 








假设 baLLoon .Location 的 值 是 Point { x: 30，y: 40 }。 那 么 ， 与 往常 一 样 ，Rust 会 依次 
检查 每 个 模式 的 每 个 组 件 ， 如 图 10-6 所 示 。 




















值 : Point { x: 30，y: 40 } 值 : point { x: 30，y: 40 } 
Ix lv lv 
模式 : Point { x: 0, y: height } 模式 : Point { x: x,y: y} 











10-6: 匹配 结构 体 模式 


第 二 个 分 支 匹配 ， 因 此 会 输出 “at {3bm，4gm}”。 

Point { x: x，y: y } 这样 的 模式 在 匹配 结构 体 时 很 常用 ， 但 重复 的 名 字 看 起 来 有 点 乱 。 
为 此 ，Rust 允许 在 这 种 情况 下 使 用 简写 形式 Point { x，y }， 含 义 不 变 。 这 个 模式 同样 全 
把 一 个 点 的 x 和 y 字段 分 别 存储 到 新 局 部 变量 x 和 y 中 。 

对 于 复杂 的 结构 体 ， 如 果 只 关心 其 中 几 个 字段 ， 那 么 就 算 使 用 这 种 简写 形式 也 会 显得 很 
喝 唆 ， 


match get_ account(id) { 











Some(Account { 
name，Language，// <--- 只 关心 这 两 个 字段 
id: _, status: _, address: _, birthday: _, eye_color: _， 
pet: _, security question: _, hashed innermost secret: _， 
is_adamantium preferred_customer: _ }) => 
language. show_custom greeting(name) 


} 
这 时 候 ， 可 以 使 用 .… 告诉 Rust 你 并 不 关心 其 他 字段 : 
Some(Account { name, language, .. }) => 


TLanguage. show_custom greeting(name) 


10.2.3 引用 模式 

对 于 引用 ，Rust 支持 两 种 模式 : ref 模式 和 & 模式 。 前 者 借用 匹配 值 的 元 素 ， 后 者 匹配 引 
用 。 先 来 看 ref 模式 。 

匹配 不 可 复制 的 值 会 转移 值 。 仍 然 以 前 面 的 Account 结构 体 为 例 ， 以 下 代码 是 无 效 的 : 


match account { 
Account { name, language, .. } =>> { 
ui.greet(&name, &language); 
ui.show_settings(&account); // 错误 : 使 用 转移 的 值 account 

















} 


这 里 ， 字 段 account.name 和 account.Language 被 转移 到 了 局 部 变量 name 和 Language 中 。 
account 的 其 他 元 素 则 被 丢弃 了 。 这 就 是 不 能 在 后 面 的 方法 中 使 用 account 的 原因 。 
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如 果 name 和 Language 都 是 可 以 复制 的 值 ，Rust 则 会 复制 这 两 个 字段 ， 而 不 是 转移 它们 。 
这 时 候 前 面 的 代码 是 有 效 的 。 但 假设 它们 就 是 不 可 复制 的 String 该 怎么 办 ? 


我 们 需要 一 种 模式 来 借用 而 不 转移 匹配 的 值 。 关 键 字 ref 就 是 做 这 个 用 的 : 


match account { 

Account { ref name, ref language, .. } => { 
ui.greet(name, language); 
ut.show_settings(&account); // 没 问 题 

} 

} 


现在 局 部 变量 name 和 Language 中 存储 的 是 对 account 中 对 应 字段 的 引用 。 由 于 account 只 
是 被 借用 而 不 是 被 消费 了 ， 因 此 后 面 的 方法 继续 使 用 它 是 没 问 题 的 。 
还 可 以 使 用 ref mut 借用 mut 引用 


match Line_resuLt { 
Err(ref err) => Log_error(err)， // err 是 &Error (共享 的 ref) 



































Ok(ref mut line) => { // Line 是 &mut String (可 修改 的 ref ) 
trim_comments(line); // 就 地 修改 字符 串 
handle( line); 

} 


} 
模式 Ok(ref mut Line) 匹配 任何 成 功 的 结果 ， 并 借用 该 结果 中 存储 的 值 的 mut 引用。 
与 ref 模式 对 应 的 是 & 模式 。 以 & 开头 的 模式 匹配 引用 。 


match sphere.center() { 
&Point3d { x, y, z } => ... 
} 


在 这 个 例子 中 ,假设 sphere.center() 返回 对 sphere 中 一 个 私有 字段 的 引用 (这 是 Rust 中 
常见 的 做 法 )， 返 回 值 是 一 个 Point3d 的 地 址 。 如 果 中 心 位 于 原点 ， 那 么 sphere.center() 
返回 &Point3d { x: 0.0, y: 0.0, z: 0.0 }。 


因而 模式 匹配 过 程 如 图 10-7 所 示 。 






































值 : &Point3d { x: 0.0, y: 0.0, z: 0.0} 


lvlvkv 


模式 : &Point3d { x, y, z} 











图 10-7: 引用 的 模式 匹配 


这 有 点 不 好 理解 ， 因 为 Rust 在 这 里 跟 进 了 指针 ， 而 这 种 操作 通常 要 使 用 * 而 不 是 & 操作 
符 。 请 大 家 记 住 : 表达 式 和 模式 天 生 是 相反 的 。 表 达 式 (x，y) 用 两 个 值 创建 一 个 新 元 组 ， 
模式 (x，y) 则 相反 : 它 匹 配 元 组 并 将 其 破坏 后 取出 两 个 值 。 对 & 而 言 也 一 样 : 表达 式 中 的 
& 创建 引用 ， 模 式 中 的 & 匹配 引用 。 


























匹配 引用 遵循 前 面 介 绍 过 的 所 有 规则 。 生 命 期 是 必要 条 件 。 不 能 对 共享 引用 采取 mut 操 
作 。 不 能 从 引用 (包括 mut 引用 ) 中 转移 出 值 。 在 匹配 &8Point3d { x，y，z } 时， 变量 x、 
y 和 z 取得 的 是 坐标 的 副本 ,原始 的 Point3d 值 原封 未 动 ， 因 为 那些 字段 是 可 复制 的 。 对 
包含 不 可 复制 字段 的 结构 体 采取 同样 的 做 法 则 会 导致 错误 : 


match friend.borrow car() { 


Some(&Car { engine,.. }) => // 错误 : 借用 的 值 不 能 转移 








NODE {} 

} 
从 借 来 的 车 上 拆零 件 可 不 太 好 ，Rust 不 会 支持 这 种 行为 。 此 时 可 以 使 用 ref 模式 来 借用 对 
零件 的 引用 不 据 为 己 有 就 行 了 。 

Some(&Car { ref engine，.. }) => // 可 以 : engine 是 一 个 引用 
下 面 再 看 一 个 & 模式 的 例子 。 假 设 我 们 有 一 个 迭代 器 chars， 用 于 迭代 字符 串 中 的 字符 。 
它 有 一 个 方法 chars.peek()， 该 方法 返回 0ption<&char>， 即 对 下 一 个 字符 的 引用 (如果 
有 下 一 个 字符 的 话 )。( 这 种 带 peek() 方法 的 进 代 器 实际 上 会 返回 一 个 0ption<&ItemType>， 
第 15 章 将 介绍 。) 
程序 可 以 使 用 & 模式 取得 引用 所 指向 的 字符 : 


match chars.peek() { 
Some(&c) => println!("coming Up: {:?}", c), 
None => println!("end of chars") 



































} 


10.2.4 匹配 多 种 可 能 性 
坚 线 (1) 可 用 于 在 一 个 match 分 支 中 组 合 多 个 模式 : 


let at_end = 
match chars.peek() { 
Some(&'\r') | Some(&'\n') | None => true, 
_ => false 


拘 


在 表达 式 中 ，| 是 按 位 或 操作 符 ， 但 在 这 里 它 更 像 正 则 表达 式 中 的 | 符号 。 如 果 chars. 
peek() 匹配 三 个 模式 中 的 任何 一 个 ， 则 at_end 会 被 设置 为 true。 


使 用 .….. 可 以 匹配 某 个 范围 中 的 值 。 范 围 模 式 包含 起 点 值 和 终点 值 ， 即 '90'... '9' 匹配 
所 有 ASCII 数字 : 


match next char { 
"OY a "9 E> 
self.read_number(), 
由 
seLf .read_word()， 
”| At | \n' => 
self.skip whitespace(), 
=> 
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seLf .handLe_punctuation() 


} 


模式 中 的 范围 是 全 纳 (inclusive) 的 ， 因 此 '9' 和 '9' 都 匹配 '0' ... '9'。 相 应 地 ， 范 围 
表达 式 (中 间 是 两 个 点 ， 比 如 for n in 9..109) 则 是 半 开 放 或 互 斥 的 (包含 9 但 不 包含 
100)。 之 所 以 存在 这 种 不 一 致 的 现象 ， 主 要 是 因为 互 尺 范围 对 循环 和 片段 更 有 用 ， 而 全 纳 
范围 在 模式 匹配 中 更 有 用 。 


10.2.5 ”模式 护 具 
使 用 if 关键 字 给 match 分 支 添加 护 具 。 只 有 在 护 具 求 值 为 true 时 匹配 才 成 功 : 


match robot.last_ known_location() { 
Some(point) if self.distance to(point) < 10 => 
short_distance_strategy(point), 
Some(point) => 
long_distance_strategy(point), 
None => 
searching_strategy() 























} 


如 果 模 式 转 移 值 ， 则 不 能 给 它 添 加 护 具 。 如 果 护 具 求 值 为 false， 那 Rust 会 继续 匹配 下 一 
个 模式 。 但 如 果 待 匹配 的 值 被 转移 了 ， 那 Rust 也 就 没 法 再 继续 了。 因此 前 面 的 代码 只 对 可 
复制 的 point 有 效 ， 否 则 就 会 导致 错误 : 


error[E0008]: cannot bind by-move into a pattern guard 
--> enums_move_into_guard.rs:19:18 





























19 | Some(point) if seLf.distance_to(point) < 10 => 
| ^^^A^^ moves value into pattern guard 


解决 方法 是 将 模式 修改 为 借用 point， 而 不 是 转移 值 : Some(ref point)。 


10.2.6 4 模式 


最 后 ，x @ pattern 匹配 给 定 的 pattern， 但 成 功 之 后 ， 不 是 基于 匹配 值 的 元 素来 创建 变量 ， 
而 是 把 匹配 值 整个 转移 或 复制 到 一 个 变量 x 中 。 比 如 ,假设 有 如 下 代码 : 


match self.get selection() { 
Shape: :Rect(top_left, bottom right) => 
optimized_paint(&Shape::Rect(top_left, bottom_right)), 
other_shape => 
paint_outline(other_shape.get _outline()), 





} 


注意 ， 第 一 个 分 支 拆 解 出 Shape::Rect 值 ， 仅 仅 是 为 了 在 下 一 行 再 重新 创建 一 个 相同 的 
Shape: :Rect 值 。 这 里 可 以 用 @ 模式 重 写 为 : 


rect @ Shape::Rect(..) => 
optimized paint(&rect), 


@ 模式 在 匹配 范围 时 也 有 用 : 
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match chars.next() { 
Some(digit @ '0' ... '9') => read number(digit, chars), 


3} 


10.2.7 ”在 哪里 使 用 模式 


除了 最 明显 地 用 在 match 表达 式 中 ， 模 式 还 可 以 用 在 其 他 一 些 地 方 ， 通 常用 于 代替 标识 
符 。 无 论 用 在 哪里 ， 用 途 都 不 变 : 通过 模式 匹配 实现 拆 解 值 ， 而 不 是 仅仅 把 值 保存 在 一 








// …… 将 结构 体 拆 解 为 3 个 新 的 局 部 变量 


Let Track { album, track_number, title, .. } = song; 


/1/…… 拆 解 作为 函数 参数 的 元 组 
fn distance_to((x, y): (f64, f64)) -> f64 { ...} 


i 迭代 HashMap 的 键 和 值 
for (id, document) in &cache map { 
println!("Document #{}: {}", id, document.title); 


Bn 自动 对 传 给 闭 包 的 参数 解 引 用 (有 时候 你 想 要 副本 ， 

// 而 其 他 代码 传 的 是 引用 ， 这 时 候 就 方便 了 ) 

Let sum = numbers.foLd(0，|a，&num| a + Num); 
前 面 每 个 例子 都 能 节省 2 到 3 行 样板 代码 。 其 他 语言 也 有 同样 的 概念 ，JavaScript 中 叫 解 
构 (destructuring) ，Python 中 叫 解 包 (unpacking ) 。 


注意 ， 这 4 个 例子 中 使 用 的 都 是 保证 能 匹配 的 模式 。 模 式 Track { album， track_number， 
title，.。. 了】 了 匹配 结构 体 Track 中 指定 的 值 ，(x，y) 匹配 任意 (f64，f64) 元 组 ， 等 等 。 始 
终 都 可 以 匹配 的 模式 在 Rust 中 是 一 种 特殊 模式 ， 叫 不 可 驳 模 式 (irrefutable pattern) 。 它 们 
是 仅 有 的 可 以 出 现 以 上 代码 中 所 示 4 个 位 置 (let 后 面 、 函 数 参 数 中 、for 后 面 、 闭 包 参 数 
中 ) 的 模式 。 
可 了 驶 模式 (refutable pattern) 指 的 是 那些 可 能 不 会 匹配 的 模式 ， 比 如 0k(x) 不 会 匹配 错误 
结果 ，'9' ... '9' 则 不 会 匹配 字符 'Q'。 可 驳 模 式 可 用 于 match 表达 式 中 ， 因 为 match 表 
达 式 是 专门 为 其 设计 的 : 如 果 一 个 模式 匹配 失败 ， 那 么 还 有 下 一 个 。 前 面 4 个 例子 中 所 示 
的 是 Rust 程序 中 可 以 利用 模式 之 便 的 位 置 ， 但 语言 在 此 时 不 允许 模式 失败 。 
可 鸡 模 式 还 可 以 用 在 if let 和 while let 表达 式 中 ， 用 来 …… 

VE el 只 处 理 一 种 特定 的 枚 举 变 体 


if Let RoughTime: :InTheFuture(_，_) = user.date of birth() { 
user.set time traveler(true); 





















































LF 只 在 查 表 成 功 时 运行 某 些 代码 
if let Some(document) = cache map.get(&id) { 
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return send_cached_response(document ) ; 


} 
Ln 不 成 功 则 重复 做 一 些 事 


while let Err(err) = present_cheesy _anti robot task() { 
log_robot attempt(err) 


// 让 用 户 再 次 尝试 (可 能 还 是 人 类 ) 


























} 
// …… 手 工 遍历 一 个 迭代 器 


while Let Some(_) = lines.peek() { 
read_paragraph(&mut lines); 


} 


关于 这 两 个 表达 式 的 详细 介绍 ， 参 见 6.4 节 和 6.5 市 。 


10.2.8 填充 二 义 树 


本 章 前 面 承诺 过 要 展示 如 何 实现 BinaryTree::add() 方法 ,该 方法 用 于 向 BinaryTree 中 添 


加 相同 类 型 的 子 节 点 : 


enum BinaryTree<T> { 
Empty, 
NonEmpty(Box<TreeNode<T>>) 
} 


struct TreeNode<T> { 
element: T， 
Left: BinaryTree<T>, 
right: BinaryTree<T> 


} 











与 实现 这 个 方法 相关 的 模式 前 面 都 介绍 过 了 。 本 书 不 会 介绍 二 又 树 ， 但 熟悉 ; 











者 应 该 可 以 理解 Rust 是 如 何 实现 这 种 数据 结构 的 : 


1 impl<T: Ord> BinaryTree<T> { 
2 fn add(&mut self, value: T) { 

3 match *self { 

4 BinaryTree: :Empty => 

5 *self = BinaryTree::NonEmpty(Box::new(TreeNode { 
6 element: value, 

区 Left: BinaryTree: :Empty， 

8 right: BinaryTree: :Empty 

9 


}) ) ， 
10 BinaryTree: :NonEmpty(ref mut node) => 
11 if vaLue <= node.element { 
12 node. Left.add(value); 
13 } else{ 
14 node.right.add(value); 
15 } 
16 } 
17 } 
18 } 


这 个 概念 的 读 





第 1 行 告 诉 Rust 我 们 要 在 有 序 类 型 的 BinaryTree 上 定义 一 个 方法 。 这 里 使 用 了 与 9.5 市 讲 
过 的 在 泛 型 结构 体 上 定义 方法 一 样 的 语法 。 

如 果 当 前 的 树 *self 是 空 的 ， 那 就 简单 了 ， 第 5~9 行 运 行 ， 把 Empty 的 树 改 成 NonEmpty 的 
树 。 这 里 调用 Box: :new() 在 堆 上 分 配 了 一 个 新 的 TreeNode。 运 行 之 后 ， 这 个 树 包含 一 个 元 
素 ， 其 左 、 右 子 树 都 是 Empty 的 。 

如 果 *self 不 是 空 的 ， 那 么 第 10 行 的 模式 匹配 成 功 : 


BinaryTree: :NonEmpty(ref mut node) => 


这 个 模式 从 Box<TreeNode<T>> 中 借用 了 一 个 可 修改 引用 ， 因 此 我 们 可 以 访问 并 修改 该 树 布 
点 中 的 数据 。 这 个 引用 叫 node， 位 于 第 11~15 行 的 作用 域 中 。 由 于 这 个 节点 中 已 经 有 一 个 
元 素 了 ， 因 此 代码 必须 递归 调用 .add() 将 新 元 素 添 加 到 其 左 或 右 子 树 上 。 


可 以 像 下 面 这 样 调用 这 个 新 方法 : 


let mut tree = BinaryTree: :Empty; 
tree.add("Mercury"); 
tree.add("Venus"); 






































10.3 设计 的 考量 

Rust 的 枚 举 对 系统 编程 来 讲 可 能 是 个 新 东西 ， 但 它 不 是 一 个 新 想法 。 实 际 上 它们 在 函数 式 
编程 语言 中 已 经 存在 40 多 年 了 ， 而 且 有 着 各 种 学 术 气 息 浓 厚 的 名 字 ， 比 如 代数 数据 类 型 
(algebraic data type)。 不 清楚 为 什么 C 流派 其 他 语言 支持 这 个 概念 的 那么 少 。 有 可 能 是 因为 
对 编程 语言 设计 者 来 说 ， 要 做 到 变 体 (variant)、 引 用 、 可 变性 (mutability) 和 内 存 安全 4 
方面 兼 得 ， 确 实 是 极 大 的 挑 成 。 函 数 编程 语言 不 需要 可 变性 ， 因 为 没 必要 。 而 C 的 union 
同时 支持 变 体 、 指 针 和 可 变性 ， 但 其 骇 人 的 不 安全 性 也 导致 人 们 不 到 万 不 得 已 不 会 萎 虑 它 。 
Rust 的 借用 检查 机 制 魔 法 般 地 做 到 了 既 把 这 4 方面 组 合 起 来 ， 又 没有 在 任何 一 方面 打折 扣 。 
编程 就 是 处 理 数 据 。 简 短 、 快 捷 、 优 雅 的 程序 和 庞大 、 缓 慢 、 充 斥 着 连接 绑 定 及 虚拟 方法 
调用 的 杂 混 代码 之 间 的 区 别 ， 就 在 于 数据 形态 是 否 合理 。 


这 正 是 枚 举 的 用 武之 地 。 换 名 话说 ， 枚 举 其 实 是 特定 数据 形态 的 设计 工具 。 一 个 值 可 能 是 
一 个 值 ， 也 可 能 是 另外 一 个 值 ， 还 有 可 能 什么 也 不 是 。 这 种 情况 很 普遍 ， 而 相 较 于 有 登 床 架 
屋 式 的 类 层级 ， 无 论 从 哪个 维度 看 枚 举 都 更 胜 一 筹 : 速度 更 快 、 更 加 安全 、 代 码 更 少 ， 写 
文档 也 更 简单 。 

限制 因素 是 灵活 性 。 枚 举 的 最 终 用 户 不 能 扩展 枚 举 ， 比 如 添加 一 个 新 变 体 。 要 添加 变 体 只 能 
修改 枚 举 的 声明 。 而 一 旦 修改 了 声明 ， 现 有 代码 就 不 能 用 了 。 必 须 重 新 检查 匹配 枚 举 中 每 个 
变 体 的 每 个 match 表达 式 ， 因 为 需要 给 它们 都 添加 一 个 新 分 支 以 处 理 新 变 体 。 有 时 候 ， 牺 牧 
灵活 性 换取 简单 恰恰 是 合理 的 。 有 谁 认为 JSON 的 数据 结构 会 变 来 变 去 呢 ? 而 某 些 情况 下 ， 
在 枚 举 改变 时 重新 检查 所 有 用 例 实际 上 正 是 我 们 希望 的 。 比 如 ， 某 个 编译 器 使 用 enun 表示 
一 种 编程 语言 的 不 同 操 作 符 。 新 增 一 个 操作 符 ， 必 然 要 求 重新 检查 处 理 操作 符 的 所 有 代码 。 


不 过 有 时 候 还 是 需要 更 多 灵活 性 的 。Rust 为 此 提供 了 特 型 ， 这 也 是 下 一 章 的 主题 。 
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第 11 章 





特 型 与 泛 型 


计算 机 科学 家 倾向 于 处 理 不 统一 的 结构 ， 情 形 1、 情 形 2、 情 形 3…… 而 数学 家 
倾向 于 拥有 一 个 适用 于 整个 系统 的 统一 的 公理 。 


一 一 Donald Knuth 


编程 中 的 一 个 重大 发 现 ， 就 是 可 以 编写 对 很 多 不 同类 型 的 值 进行 操作 的 代码 ， 甚 至 是 那些 
尚未 发 明 的 类 型 。 下 面 是 两 个 例子 。 








。 Vec<T> 是 泛 型 : 你 可 以 创建 一 个 包含 任何 类 型 值 的 向 量 ， 包 括 在 自己 程序 里 


Vec 作者 决 不 会 想到 的 类 型 。 





甸 定 义 的 、 














很 多 东西 有 .write() 方法 ， 包 括 File 和 TcpStream。 代 码 可 以 通过 引用 获得 一 个 书写 








器 (writer)， 不 管 是 什么 书写 器 ， 然 后 将 数据 发 送 给 它 。 此 时 不 必 关 心 书写 器 的 类 型 。 





将 来 ， 如 果 有 人 写 了 一 个 新 的 - 


节 写 器 类 型 ， 那 你 的 代码 照样 支持 它 。 


当然 ， 这 种 能 力 对 Rust 而 言 不 是 什么 新 东西 。 这 叫 作 多 态 性 ， 是 20 世纪 70 年 代 在 编程 语 


言 领域 非常 火 的 一 种 技术 。 到 了 今天 ， 多 态 性 已 经 无 所 不 在 了 。Rust 对 多 态 性 的 支持 构建 





于 两 个 相关 特性 之 上 : 特 型 (trait) 和 泛 型 (generic)。 很 多 程序 员 对 这 两 个 概念 不 陌生 ， 


但 Rust 在 Haskell 类 型 类 (typecla 


ss) 的 启发 下 采用 了 一 种 新 思路 。 


特 型 是 Rust 对 接口 或 抽象 基 类 的 实现 。 首 先 ， 它 看 起 来 就 像 Java 或 C# 中 的 接口 。 比 如 写 
字 市 的 特 型 叫 std: :io: :Write， 它 在 标准 库 中 定义 的 开头 是 这 样 的 : 


trait Write { 
fn write(&mut self, buf: 








&[u8]) -> Result<usize>; 


fn flush(&mut self) -> Result<()>; 
fn write all(&mut self, buf: &[u8]) -> Result<()> { ... } 


} 


这 个 特 型 声明 了 不 少 方法 ， 这 里 仅 展 示 了 3 个 。 
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标准 类 型 File 和 TcpStreanm 都 实现 了 std::io::Write，Vec<u8> 也 实现 std::io::Write。 
那么 这 3 个 类 型 就 都 有 了 名 为 .write()、.flush() 等 的 方法 。 使 用 书写 器 但 又 不 关心 其 类 
型 的 代码 如 下 : 


use std::io::Write; 


fn say_hello(out: &mut Write) -> std::io::Result<()> { 
out.write all(b"hello world\n")?; 
out.flush() 

} 


out 的 类 型 是 &mut Write， 含义 是 “一 个 对 实现 Write 特 型 的 任意 值 的 可 修改 引用 ”。 


use std::fs::File; 
Let mut local_ file = File::create("hello.txt")?; 
say_hello(&mut local_file)?; // 没 问 题 


Let mut bytes = vec![]; 

say_hello(&mut bytes)?; // 同样 没 问题 

assert_eq!(bytes, b"hello world\n"); 
本 章 将 首先 介绍 如 何 使 用 特 型 、 它 们 的 工作 原理 ， 以 及 如 何 自 定义 特 型 。 到 目前 为 止 , 我 
们 了 解 到 的 特 型 只 是 冰山 一 角 。 可 以 通过 它 给 现 有 类 型 甚至 str 和 bool 等 内 置 类 型 添加 
扩展 方法 。 本 章 接 下 来 解释 为 什么 把 特 型 添加 给 类 型 不 用 花 额外 内 存 ， 以 及 如 何在 没有 虚 
拟 方法 调用 开销 的 前 提 下 使 用 特 型 。 我 们 会 看 到 ， 内 置 特 型 其 实 是 Rust 语言 为 操作 符 重 
载 及 其 他 特性 提供 的 钧 子 (hook) 。 本 章 还 会 介绍 Self 类 型 、 关 联 方法 和 关联 类 型 这 3 个 
Rust 从 Haskell 中 抄 来 的 特性 ， 这 些 特性 可 以 优雅 地 解决 别 的 语言 只 能 以 权宜 之 计 和 黑 招 
数 (hack) 解决 的 问题 。 


泛 型 是 Rust 中 另 一 种 多 态 性 的 实现 。 类 似 C++ 模板， 泛 型 函数 或 类 型 可 以 搭配 很 多 种 不 
同类 型 的 值 使 用 。 


/// 给 定 两 个 值 ， 取 出 较 小 的 
fn min<T: Ord>(value1: T, value2: T) -> T{ 
if vaLuel <= value2 { 
valuel 
} elsef{ 
value2 








} 
} 


这 个 函数 中 的 <T: 0rd> 代表 min 可 以 使 用 实现 0rd 特 型 的 任意 类 型 参数 T (也 就 是 任意 有 
序 类 型 )。 编 译 器 会 为 每 个 实际 使 用 的 类 型 生成 定制 的 机 器 码 。 


泛 型 与 特 型 紧密 相关 。Rust 让 我 们 在 使 用 <= 操作 符 比 较 类 型 T 的 两 个 值 之 前 ， 先 行 声明 
T: 0rd 这 个 条 件 〈 叫 作 绑 定 ) 。 本 章 接 下 来 会 谈 谈 &mut Write 和 <T: Write> 为 什么 相似 、 
它们 有 哪些 区 别 ， 以 及 它们 各 自 适 用 的 情形 。 


11.1 使 用 特 型 


特 型 是 一 种 任何 类 型 都 可 以 选择 支持 或 不 支持 的 特性 。 通 常 ， 特 型 代表 一 种 能 力 ， 即 某 类 
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型 能 做 什么 。 

。 实现 std::io::Write 的 值 可 以 执行 写字 节操 作 。 

。 实现 std::iter::Iterator 的 值 可 以 产生 值 的 序列 。 

。 实现 std::clone::Clone 的 值 可 以 在 内 存 中 克隆 自身 。 

。 实现 std: :fmt::Debug 的 值 可 以 使 用 println!() 的 {:?} 格式 说 明 符 打印 出 来 。 

以 上 列举 的 几 个 特 型 都 是 Rust 标准 库 的 一 部 分 ， 很 多 标准 库 类 型 实现 了 它们 。 
std: :fs::File 实现 了 Write 特 型 ， 从 而 能 够 将 字 节 写 入 本 地 文件 。std: :net: :TcpStream 
则 是 将 字 节 写 入 网 络 连接 。Vec<u8> 同样 实现 了 Write。 在 字 市 向 量 上 每 次 调用 .write()， 
都 可 以 在 向 量 末尾 追加 一 些 数 据 。 

。 Range<i32> ( 即 9..19 的 类 型 ) 实现 了 Iterator 特 型 ， 而 与 切片 、 散 列表 等 相关 的 其 他 
过 代 器 类 型 也 实现 了 它 。 

。 大 多 数 标准 库 类 型 实现 了 Clone。 例 外 情况 主要 是 Tcpstream 这 种 不 仅仅 表示 内 存 中 数 
据 的 类 型 。 

。 类 似 地 ， 大 多 数 标准 库 类 型 支持 Debug。 

提 到 使 用 特 型 方法 ， 有 一 个 不 同 寻 常 的 规则 特 型 本 身 必 须 在 作用 域 中 。 否 则 ， 特 型 的 所 

有 方法 都 是 隐藏 的 。 


Let mut buf: Vec<u8> = vec![]; 
buf .write_aLL(b"heLto")?; // 错误 : 没有 找到 名 为 write_all 的 方法 


此 时 ， 编 译 器 会 打印 一 条 友好 的 错误 消息 ， 建 议 你 添加 use std::io::Write;。 还 确实 管用 : 


use std::io::Write; 











Let mut buf: Vec<u8> = vec![]; 
buf .write_all(b"hello")?; // 可 以 


Rust 设 定 这 个 规则 是 因为 (正如 本 章 后 面 会 讲 到 的 ) 你 的 代码 可 以 使 用 特 型 给 任何 类 型 添 
加 新 方法 ， 即 使 是 u32 和 str 这 种 标准 库 类 型 也 不 例外 。 第 三 方 包 也 可 以 做 同样 的 事 。 显 
然 ， 这 可 能 会 导致 命名 冲突 。 但 是 ， 因 为 Rust 要 求 必须 导入 自己 想 用 的 特 型 ， 所 以 第 三 方 
包 可 以 自由 利用 这 个 超 能 力 ， 而 在 实践 中 冲突 并 不 多 见 。 

Clone 和 Iterator 方法 之 所 以 在 没有 特定 导入 的 情况 下 也 能 使 用 ， 是 因为 它们 默认 一 直 在 作 
用 域 中 。 它 们 是 标准 前 置 模块 的 一 部 分 ， 所 以 Rust 会 将 其 自动 导入 到 所 有 模块 中 。 事 实 上 ， 
前 置 模块 很 大 程度 上 可 以 说 是 一 个 精心 挑选 的 特 型 集合 。 第 13 章 会 介绍 其 中 很 多 特 型 。 
C++ 和 C# 程序 员 可 能 已 经 注意 到 了 ， 特 型 方法 很 像 虚拟 方法 。 同 样 ， 类 似 上 面 的 调用 非 
常 快 ， 跟 任何 其 他 方法 调用 一 样 快 。 简 单 地 说 ， 就 是 没有 发 生 多 态 。 很 明显 ，buf 是 一 个 
向 量 而 非 文 件 或 网 络 连接 。 编 译 器 可 以 发 出 对 Vec<u8>: :write() 的 简单 调用 ， 甚 至 可 以 将 
该 方法 行内 化 。(C++ 和 C# 的 思路 也 差不多 ， 只 是 子 类 化 有 可 能 会 阻止 这 么 做 。) 只 有 通 
过 &mut Write 调用 才 会 产生 虚拟 方法 调用 的 消耗 。 


11.1.1 特 型 目标 
在 Rust 中 有 两 种 方式 使 用 特 型 编写 多 态 化 代码 : 特 型 目标 和 泛 型 。 接 下 来 先 看 看 如 何 使 用 
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特 型 目标 ， 然 后 再 说 泛 型 。 
Rust 不 允许 声明 Write 类 型 的 变量 : 
use std::io::Write; 


Let mut buf: Vec<u8> = vec![]; 
Let writer: Write = buf; // 错误 : Write 没 有 固定 大 小 


变量 的 大 小 必须 在 编译 时 就 知道 ， 而 实现 write 的 类 型 可 以 是 任意 大 小 。 

熟悉 C# 和 Java 的 程序 员 可 能 觉得 不 可 思议 ， 但 原因 很 简单 。 在 Java 中 ，0utputStream 
(与 std::io::Write 类 似 的 Java 标准 接口 ) 类 型 的 变量 是 一 个 引用 ， 指 向 任何 实现 
OutputStrean 的 对 象 。 事 实 上， 这 个 变量 是 一 个 引用 不 言 而 喻 。 对 C# 以 及 其 他 大 多 数 语 
言 中 的 接口 来 说 ， 也 是 一 样 的 。 

在 Rust 中 我 们 想 要 的 其 实 也 一 样 ， 只 不 过 Rust 中 的 引用 是 显 式 的 : 


Let mut buf: Vec<u8> = vec![]; 
let writer: &mut Write = &mut buf; // 可 以 


指向 一 个 特 型 类 型 (如 writer) 的 引用 ， 称 为 特 型 目标 (trait object)。 与 其 他 引用 类 似 ， 
特 型 目标 也 指向 某 个 值 ， 有 生命 期 ， 可 以 是 mut 或 共享 引用 。 


特 型 目标 的 不 同 之 处 在 于 ，Rust 在 编译 时 通常 不 知道 引用 目标 的 类 型 。 因 此 特 型 目标 还 要 
包含 一 些 关于 引用 目标 类 型 的 额外 信息 。 这 个 信息 严格 限于 Rust 内 部 自己 使 用 。 在 调用 
writer .write(data) 时 ，Rust 需要 知道 类 型 信息 ， 才 能 根据 *writer 的 类 型 动态 调用 正确 
的 write 方法 。 任 何人 都 无 法 直接 查询 这 个 类 型 信息 ，Rust 也 不 支持 特 型 目标 amut write 
到 具体 类 型 如 Vec<u8> 的 向 下 转型 。 


11.1.2 ” 特 型 目标 布局 


在 内 存 中 ， 特 型 目标 是 一 个 胖 指 针 ， 包 含 指向 值 的 指针 和 指向 表示 该 值 类 型 的 表 的 指针 。 
因此 ， 每 个 特 型 目标 都 占用 两 个 机 器 字 ， 如 图 11-1 所 示 。 


























&mut bufas &mut Write 
( 特 型 目标 ) 



















vtable 
impl Write for Vec<u8> 





buffer: 
capacity: 
length: 








destructor 
Size 
alignment 
.Write() 
flush() 
.Write_all() 





(指向 机 器 码 ) 











11-1; 特 型 目标 的 内 存 布 局 
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C++ 同样 也 有 这 种 运行 时 类 型 信息 ， 其 被 称 为 虚拟 表 (virtual table) 或 vtable。 跟 C++ 一 
样 ， 在 Rust 中 ， 虚 拟 表 同样 只 在 编译 时 生成 一 次 ， 由 同类 型 的 所 有 对 象 共享 。 图 11-1 中 
的 深 灰 色 表 (包括 vtable) 都 是 Rust 的 私有 实现 细节 。 再 说 一 次 ， 这 些 字段 和 数据 结构 无 
法 直接 访问 。 相 反 ， 当 你 调用 一 个 特 型 目标 方法 时 ， 语 言 会 自动 使 用 虚拟 表 ， 以 确定 调用 
哪个 实现 。 

经 验 丰富 的 C++ 程序 员 会 注意 到 Rust 和 C++ 在 内 存 使 用 上 有 一 点 不 同 。 在 C++ 中 ， 虚 拟 
表 指 针 或 vptr 被 保存 为 结构 体 的 一 部 分 。 而 Rust 使 用 的 是 胖 指针 。 结 构 体 本 身 除 了 自己 
的 字段 之 外 设 有 别 的 。 这 样 ， 一 个 结构 体能 够 实现 很 多 特 型 而 不 必 包 含 同样 多 的 vptr。 即 
使 像 132 这 样 没 有 足够 空间 容纳 vptr 的 类 型 都 可 以 实现 特 型 。 

Rust 在 必要 时 会 自动 将 普通 引用 转换 为 特 型 目标 。 这 也 是 可 以 在 如 下 示例 中 将 &mut 
local_file 传 给 say_hello 的 原因 : 
































Let mut local file = File::create("hello.txt")?; 
say_heLLo(&mut local file)?; 


&mut local_file 的 类 型 是 &mut File， 而 say_hello 的 参数 类 型 是 &mut Write。 因 为 File 
也 是 一 种 书写 器 ， 所 以 Rust 允许 这 样 传递 ， 自 动 将 普通 引用 转换 为 特 型 目标 。 
类 似 地 ，Rust 会 很 高 兴 地 将 Box<File> 转换 为 Box<Write> (拥有 分 配 在 堆 内 存 上 的 一 个 书 
写 器 的 值 ) : 

Let w: Box<Write> = Box::new(local file); 
与 &mut Write 类 似 ，Box<Write> 也 是 一 个 胖 指针 ， 包 含 书 写 器 自身 的 地 址 和 虚拟 表 的 地 
址 。 至 于 其 他 指针 类 型 ， 比 如 Rc<Write>， 也 是 一 样 的 。 
这 种 转换 是 创建 特 型 目标 的 唯一 方式 。 计 算 机 在 这 里 做 的 事情 其 实 很 简单 。 在 转换 发 生 
时 ，Rust 知道 引用 目标 的 真正 类 型 (在 这 里 是 File)， 于 是 它 只 要 给 普通 指针 加 上 对 应 虚 
拟 表 的 地 址 就 把 它 变 成 了 胖 指 针 。 


11.1.3” 泛 型 函数 
本 章 开始 时 展示 了 一 个 say_hello() 函数 ， 该 函数 接收 一 个 特 型 目标 作为 参数 。 现 在 把 它 
重 写 为 一 个 泛 型 函数 : 


fn say_hello<W: Write>(out: &mut W) -> std::io::Result<()> { 
out.write all(b"hello world\n")?; 
out.flush() 

} 


只 有 类 型 签名 发 生 了 变化 : 


fn say_hello(out: &mut Write) // 普通 函数 










































































fn say_hello<W: Write>(out: &mut W) // 泛 型 国 数 


这 里 让 函数 变 成 泛 型 的 是 <N: Write>， 可 以 称 之 为 类 型 参数 (type parameter)。 有 了 这 个 
类 型 参数 ， 就 意味 着 在 整个 函数 体内 ,WW 始终 表示 实现 了 Write 特 型 的 某 种 类 型 。 按 照 惯 
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例 ， 类 型 参数 通常 是 一 个 大 写字 母 。 

W 到 底 表示 哪 种 类 型 取决 于 如 何 使 用 泛 型 函数 : 
say_hello(&mut local_file)?; // 调用 say_hello::<File> 
say_heLLo(&mut bytes)?; // 调用 say_hello::<Vec<u8>> 


如 果 把 &mut local_file 传 给 泛 型 国 数 say_hello()， 那 么 调用 的 就 是 say_hello::<File>()。 
Rust 会 为 这 个 函数 生成 调用 。 :write_aLL() 和 File::flush() 的 机 器 码 。 如 果 传 递 的 是 
&mut bytes， 那 么 调用 的 就 是 say_hello::<Vec<u8>>()。Rust 同样 会 为 这 个 版 本 的 函数 生 
成 单独 的 机 器 码 ， 调 用 Vec<u8> 上 对 应 的 方法 。 两 种 情况 下 ，Rust 都 会 根据 参数 的 类 型 来 
推断 的 类 型 。 当 然 ， 可 以 把 类 型 参数 直接 写 出 来 : 


say_hello::<File>(&mut local_file)?; 








但 很 少 有 这 样 写 的 必要 ， 因 为 Rust 能 根据 参数 推断 出 类 型 参数 。 在 此 ，say_hello 泛 型 函 
数 想 要 一 个 &mut W 参数 ， 而 传 给 它 的 是 &mut File， 于 是 Rust 推断 W = File。 
如 果 调 用 的 泛 型 函数 本 身 没 有 参数 可 以 提供 有 用 的 提示 ， 那 怒 怕 只 能 明确 地 把 类 型 参数 写 
出 来 了 : 

// 调用 一 个 不 接收 参数 的 泛 型 方法 collect<C>() 


Let v1 = (0 .. 1000).collect(); // 错误 : 无 法 推断 类 型 
let v2 = (0 .. 1000).collect::<Vec<i32>>(); // 可 以 


有 时 候 ， 我 们 需要 类 型 参数 提供 多 种 能 力 。 比 如 ， 假 设 我 们 想 打印 出 向 量 中 最 常见 的 10 
个 值 ， sn : 


use std::fmt::Debug; 








fn top_ten<T: Debug>(vaLues: &Vec<T>) { ... } 


但 这 样 还 不 够 。 你 打算 怎样 确定 哪些 值 是 最 常见 的 ?通常 的 做 法 是 使 用 值 作为 散 列 表 的 
键 。 这 意味 着 这 些 值 需要 支持 Hash 和 Eq 操作 。T 的 绑 定 中 必须 还 得 包含 Debug。 此 时 对 应 
的 语法 是 使 用 + 号 : 


fn top_ten<T: Debug + Hash + Eq>(vaLues: &Vec<T>) { ... } 


有 些 类 型 实现 了 Debug， 有 些 类 型 实现 了 Hash， 有 些 类 型 支持 Efq， 还 有 少数 像 u32 和 String 
这 样 的 类 型 同时 实现 了 这 3 个 ， 如 图 11-2 所 示 。 








Debug 


std::net::TcpStream 
std::time::Instant 


U32 














11-2; 按 支持 的 特 型 对 类 型 分 类 





特 型 与 泛 型 | 197 


当然 ， 类 型 参数 也 可 能 什么 都 不 绑 定 。 问 题 是 如 果 不 指 定 任 何 绑 定 ， 那 几乎 对 值 什 么 也 做 
不 了 。 可 以 转移 它 ， 可 以 把 它 装 箱 或 放 到 向 量 中 ， 也 就 这 样 了 。 
泛 型 函数 可 以 有 多 个 类 型 参数 : 

/// 对 大 型 、 分 段 数 据 集运 行 查 询 ， 参 见 GoogLe 上 的 MapReduce 算 法 论文 

fn run_query<M: Mapper + Serialize, R: Reducer + Serialize>( 


data: &DataSet, map: M, reduce: R) -> ResuLts 


Ee 


如 上 面 的 例子 所 示 ， 绑 定 会 变 得 很 长 ， 因 此 对 眼睛 非常 不 利 。Rust 为 此 提供 了 使 用 关键 字 
where 的 替代 语法 : 
fn run_query<M, R>(data: &DataSet, map: M, reduce: R) -> Results 


where M: Mapper + Serialize, 
R: Reducer + Serialize 


Em 


类 型 参数 M 和 R 仍然 是 提前 声明 的 ， 只 不 过 绑 定 转移 到 了 另外 两 行 上 。 这 种 where 子 句 也 
适用 于 泛 型 结构 体 、 枚 举 、 类 型 别名 和 方法 ， 总 之 任何 允许 绑 定 的 地 方 。 


当然 ， 对 where 子 句 的 替代 方案 就 是 保持 简单 ， 找 一 种 不 那么 集中 使 用 泛 型 的 编程 方式 。 


5.2.2 节 介 绍 了 生命 期 参数 的 语法 。 泛 型 国 数 可 以 同时 拥有 生命 期 参数 和 类 型 参数 。 生 命 期 
参数 在 前 面 。 
/// 返回 距离 target 点 最 近 的 candidates 点 中 的 引用 
fn nearest<'t, 'c, P>(target: &'t PpP, candidates: &'c [P]) -> &'cP 
where P: MeasureDistance 


{ 

} 
这 个 函数 也 有 两 个 参数 .target 和 candidates， 它 们 都 是 引用 。 这 两 个 参数 分 别 有 自 己 
的 生命 期 : 't 和 'c (正如 5.2.6 节 中 所 讨论 的 那样 )。 此 外 ， 这 个 国 数 可 用 于 任何 实现 了 
MeasureDistance 特 型 的 类 型 P。 所 以 在 一 个 程序 中 可 以 对 Point2d 值 使 用 它 ， 而 在 另 一 个 
程序 中 对 Point3d 值 使 用 它 。 
生命 期 对 机 器 码 不 会 有 任何 影响 。 对 nearest() 的 两 次 调用 使 用 了 相同 的 类 型 Pp， 不 同 的 
生命 期 最 终 调 用 的 都 是 同一 个 编译 后 的 国 数 。 只 有 不 同 的 类 型 才 会 让 Rust 编译 出 同一 谤 型 
国 数 的 不 同 副本 。 
当然 ， 函 数 并 不 是 Rust 中 唯一 涉及 泛 型 的 代码 。 
。 9.6 节 和 10.1.4 节 已 经 介绍 过 泛 型 结构 体 和 谤 型 枚 举 。 
。 个 别 的 方法 可 以 是 泛 型 的 ， 无 论 定 义 该 方法 的 类 型 是 不 是 泛 型 的 。 


impl PancakeStack { 
fn push<T: Topping>(&mut self, goop: T) -> PancakeResult<()> { 











< 




















} 
} 
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。 类 型 别名 也 可 以 是 泛 型 的 。 
type PancakeResuLt<T> = Result<T, PancakeError>; 
。 本 章 后 面 还 会 介绍 泛 型 特 型 。 


本 疝 介 绍 的 所 有 特性 ， 包 括 绑 定 、where 子 句 、 生 命 期 参数 等 ， 可 用 于 所 有 泛 型 特性 项 ， 
而 不 仅仅 是 函数 。 


11.1.4 使 用 哪 一 个 

有 时候 到 底 该 使 用 特 型 目标 还 是 泛 型 代码 并 不 是 那么 显而易见 。 因 为 这 两 者 都 以 特 型 为 基 
础 ， 所 以 它们 有 很 多 共性 。 

如 果 你 需要 一 个 混合 类 型 的 值 全 都 在 一 起 的 集合 ， 那 特 型 目标 就 是 正确 的 选择 。 从 技术 上 
讲 ， 做 一 盘 泛 型 沙拉 (salad) 是 完全 可 能 的 : 


trait Vegetable { 




















} 


struct Salad<V: Vegetable> { 
veggies: Vec<V> 


} 


但 这 种 设计 过 于 严格 了 。 你 看 ， 每 份 这 种 沙拉 都 只 能 有 一 种 蔬菜 ， 并 非 所 有 人 都 适合 。 本 
书 的 一 位 作者 曾经 花 14 美元 买 了 一 盘 SaLad<IcebergLettuce>， 至 今 他 都 无 法 从 被 坑 的 阴 
影 中 走出 来 。 
那 怎 么 做 出 更 好 的 沙拉 呢 ? 考虑 到 Vegetable 值 的 大 小 可 能 差别 很 大 ， 因 此 不 能 向 Rust 索 
要 Vec<Vegetable>: 
struct Salad { 
veggies: Vec<Vegetable> // error: ‘Vegetable. does not have 


// a constant size 


} 
特 型 目标 可 以 解决 这 个 问题 : 


struct Salad { 
veggies: Vec<Box<Vegetable>> 


} 


每 个 Box<Vegetable> 可 以 拥有 任意 类 型 的 蔬菜 (vegetable)， 而 这 个 “箱子 ”本 身 的 大 小 
是 固定 的 : 两 个 指针 ， 适 合 保存 在 向 量 中 。 除 了 把 让 人 吃 的 沙拉 跟 “ 箱 子 ” 放 到 一 起 不 搭 
之 外 ， 这 种 结构 精确 地 匹配 了 我 们 的 要 求 。 不 仅 是 蔬菜 ， 它 也 适合 绘图 应 用 中 的 形状 、 游 
戏 中 的 怪物 、 网 络 路 由 器 中 可 插 拔 的 路 由 算法 ， 等 等 。 

选择 使 用 特 型 目标 的 另 一 个 原因 可 能 是 想 减少 编译 后 的 总 代码 量 。 对 一 个 泛 型 函数 ，Rust 
可 能 会 编译 很 多 次 ， 每 次 生成 一 种 要 使 用 类 型 的 函数 。 这 样 得 到 的 二 进 制 文件 会 比较 大 ， 
也 就 是 C+t+ 社 区 中 所 谓 的 代码 膨胀 (code bloat) 现象 。 如 今 ， 内 存 已 经 不 是 稀缺 资源 ， 
我 们 大 多 数 人 可 以 忽略 代码 大 小 。 然 而 ， 受 限 环境 依旧 存在 。 
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在 涉及 制作 沙拉 和 微 控制 器 的 场景 之 外 ， 泛 型 与 特 型 目标 相 比 有 两 个 重要 优势 。 这 就 导致 
泛 型 在 Rust 中 成 为 更 常见 的 选择 。 
第 一 个 优势 是 速度 。 每 次 Rust 编译 器 为 泛 型 函数 生成 机 器 码 时 ， 它 都 知道 自己 要 操作 的 是 
什么 类 型 ， 也 知道 当时 要 调用 哪个 write 方法 。 这 就 消除 了 动态 查找 的 时 间 。 
本 章 开 头 示 例 的 泛 型 国 数 min() 运行 起 来 就 像 调 用 我 们 单独 写 的 min_u8、min_i64、min_ 
string 之 类 的 函数 一 样 快 。 编 译 器 会 把 它们 行内 化 ， 就 跟 其 他 函数 编译 后 的 结果 一 样 。 所 以 
在 发 布 构建 中 ， 对 min::<i32> 的 调用 可 能 只 是 两 三 个 指令 。 使 用 常量 参数 (如 min(5，3)) 
的 调用 甚至 会 更 快 ， 因 为 Rust 在 编译 时 就 会 计算 出 其 结果 ， 完 全 消除 了 运行 时 成 本 。 
再 看 一 个 调用 泛 型 函数 的 例子 : 

Let mut sink = std::io::sink(); 

say_heLLo(&mut sink)?; 
这 里 的 std: :io::sink() 返回 一 个 Sink 类 型 的 书写 器 ， 这 个 书写 器 会 悄 无 声息 地 丢弃 写 入 
它 的 所 有 字 节 。 
Rust 在 为 这 个 调用 生成 机 器 码 时 ， 可 以 生成 调用 Sink: :write_all 的 代码 ， 检 查 错 误 ， 然 
后 再 调用 Sink: :flush。 这 些 都 是 这 个 泛 型 函数 体内 的 代码 说 要 做 的 。 
不 过 ，Rust 通过 分 析 这 几 个 方法 也 能 知道 : 
。 Sink::write_all() 什么 也 不 做 ; 
。 Sink::flush() 什么 也 不 做 ; 
。 两 个 方法 都 不 会 返回 错误 。 
简 言 之 ，Rust 拥有 完全 优化 这 个 函数 的 全 部 信息 。 
再 对 比 一 下 使 用 特 型 目标 的 行为 。Rust 在 编译 时 不 可 能 知道 特 型 目标 指向 的 值 的 真正 类 型 ， 
只 能 在 运行 时 确定 。 因 此 即使 明确 传人 sink， 也 无 法 消除 调用 虚拟 方法 和 检查 错误 的 成 本 。 
泛 型 的 第 二 个 优势 在 于 并 非 所 有 特 型 都 支持 特 型 目标 。 特 型 支持 的 某 些 特性 ， 比 如 静态 方 
法 ， 只 对 泛 型 有 效 ， 完 全 没有 考虑 特 型 对 象 。 本 书后 面 在 过 到 这 些 特性 时 会 明确 指出 来 。 


11.2 ”定义 和 实现 特 型 


定义 特 型 很 简单 ， 只 要 给 它 命 名 并 列 出 特 型 方法 的 类 型 签名 即 可 。 假 设 我 们 在 写 一 个 游 
戏 ， 可 能 会 定义 如 下 特 型 : 
/// 为 和 角色、 物品 和 布景 ， 总 之 游戏 世界 中 可 以 在 屏幕 上 看 到 
/// 的 一 切 定 义 一 个 特 型 
trait Visible { 
/// 在 给 定 画面 上 泻 染 对 象 


fn draw(&self, canvas: &mut Canvas ) ; 
























































/// 如 果 在 坐标 (x，y) 上 单 击 能 选择 当前 对 象 ， 就 返回 true 
fn hit_test(&seLf，x: i32, y: i32) -> bool; 
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要 实现 这 个 特 型 ， 使 用 语法 impl TraitName for Type: 


impl Visible for Broom { 
fn draw(&self, canvas: &mut Canvas) { 
for y in self.y - self.height - 1 .. self.y { 
canvas.write at(self.x, y, '|'); 


} 


canvas.write at(self.x, self.y, 'M'); 


} 


fn hit_ test(&self, x: i32, y: i32) -> bool { 
self.x == x 
&& self.y - self.height - 1 <= y 
&& y <= self.y 


} 


注意 ， 这 个 impl 包含 对 Visible 特 型 每 个 方法 的 实现 ， 除 此 之 外 什么 也 没有 。 特 型 impl 
切 都 必须 是 特 型 的 特性 。 如 果 想 添加 一 个 支持 Broom: :draw() 的 辅助 方法 ， 那 
各 需要 在 单独 的 impl 块 中 定义 它 


impl Broom { 


/// 由 下 面 的 Broom: :draw() 使 用 的 辅助 函数 
fn broomstick_range(&self) -> Range<i32> { 
self.y - self.height - 1 .. self.y 











} 
} 


impl Visible for Broom { 
fn draw(&self, canvas: &mut Canvas) { 
for y in self.broomstick _ range() { 


i 本 


11.2.1 默认 方法 
前 面 讨论 的 Sink 书写 器 类 型 可 以 用 几 行 代码 实现 。 首 先 ， 要 定义 这 个 类 型 ， 
/// 忽略 任何 写 人 数据 的 书写 器 


pub struct Sink; 


sink 是 一 个 空 结构 体 ， 因 为 不 需要 它 存储 任何 数据 。 接 下 来 ， 为 Sink 提供 一 个 write 特 
a 


use std::io::{Write, Result}; 




















impl Write for Sink { 
fn write(&mut self, buf: &[u8]) -> Result<usize> { 
// 声明 已 经 成 功 写 完整 个 缓冲 
Ok(buf. len()) 





} 


fn flush(&mut self) -> ResuLt<()> { 
Ok(()) 
} 
} 
现在 看 来 ， 这 很 像 Visible 特 型 。 但 我 们 也 看 到 了 ，Write 特 型 有 一 个 write_all 方法 : 


out.write all(b"hello world\n")?; 
为 什么 Rust 允许 impl Write for Sink 不 定义 这 个 方法 ? 答案 是 标准 库 中 Write 特 型 的 定 
义 包含 一 个 write_all 的 默认 实现 : 


trait Write { 
fn write(&mut self, buf: &[u8]) -> Result<usize>; 
fn flush(&mut self) -> Result<()>; 





fn write_aLL(&mut self, buf: &[u8]) -> Result<()> { 
Let mut bytes written = 0; 
while bytes written < buf.len() { 
bytes written += self.write(&buf[bytes_ written..])?; 


} 
Ok(()) 


} 


write 和 flush 方法 是 每 个 书写 器 必须 实现 的 基本 方法 。 书 写 器 也 可 以 实现 write_all, 但 
如 果 没 有 ， 就 会 使 用 上 面 展示 的 默认 实现 。 


同样 ， 自 定义 特 型 也 可 以 使 用 上 面 的 语法 包含 默认 的 方法 实现 。 

标准 库 中 使 用 默认 方法 最 多 的 是 Iterator 特 型 ， 它 有 一 个 必需 方法 (.next()) 和 很 多 默 
认 方 法 。 第 15 章 将 解释 这 是 为 什么 。 

11.2.2 ” 特 型 与 其 他 人 的 类 型 

Rust 允许 在 任意 类 型 上 实现 任意 特 型 ， 只 要 当前 包 中 导入 了 相关 特 型 或 类 型 即 可 。 

这 意味 着 ,每 当 想 给 任何 类 型 添加 方法 时 ， 都 可 以 使 用 一 个 特 型 来 完成 : 


trait IsEmoji { 
fn is_ emoji(&self) -> bool; 





























} 


/// 为 内 置 字符 类 型 实现 IsEmoji 
impl IsEmoji for char { 
fn is_emoji(&self) -> bool { 


} 
} 


assert eq!('$'.is emoji(), false); 








跟 其 他 特 型 方法 一 样 ， 这 个 新 的 is_emoji 方法 只 有 IsEmoji 在 当前 作用 域 时 才 可 见 。 

上 面 这 个 特定 特 型 存在 的 唯一 目的 是 给 一 个 已 有 的 类 型 char 添加 方法 。 这 种 特 型 称 为 扩 
展 特 型 。 当 然 ， 通 过 编写 impl IsEmoji for str { ... } 等 也 可 以 让 其 他 类 型 实现 这 个 
特 型 。 

甚至 ， 可 以 使 用 泛 型 impl 块 让 一 个 类 型 家 族 一 次 性 全 部 实现 一 个 扩展 特 型 。 以 下 扩展 特 型 
为 所 有 Rust 书写 器 都 添加 了 一 个 方法 : 


use std::io::{self, Write}; 




















/// 为 可 以 发 送 HTML 的 值 定义 扩展 特 型 
trait WriteHtml { 
fn write html(&mut self, html: &HtmLDocument) -> io::Result<()>; 


} 


/// 这 样 就 可 以 向 任意 std: :io: :writer 写 入 HTML 了 
impl<W: Write> WriteHtml for W { 
fn write_htmL(&mut self, html: &HtmLDocument) -> io::Result<()> { 





3 
} 
impl<W: Write> WriteHtml for W 的 意思 是 :“ 对 每 个 实现 了 Write 的 类 型 nu， 在 这 里 为 W 
再 实现 特 型 WriteHtml。” 


要 了 解 在 标准 类 型 上 实现 用 户 定义 特 型 的 价值 ， 可 以 参考 serde 库 。 这 个 库 是 用 于 实现 序 
列 化 的 ， 也 就 是 说 ， 可 以 使 用 serde 把 Rust 数据 结构 写 到 磁盘 上 ， 以 便 将 来 重新 加 载 。 这 
个 库 定 义 了 一 个 叫 serialize 的 特 型 ， 并 在 它 支持 的 所 有 数据 类 型 上 都 实现 了 该 特 型 。 
此 ， 在 serde 源 代码 中 ， 有 一 些 代 码 通过 所 有 像 Vec 和 HashMap 这 样 标准 的 数据 结构 为 
bool、i8、i16、i32、 数 组 和 元 组 类 型 等 实现 了 Serialize。 


最 终结 果 是 serde 为 所 有 这 些 类 型 都 添加 了 一 个 .serialize() 方法 ， 可 以 这 样 使 用 : 


use serde::Serialize; 
use serde_json; 

















pub fn save_configuration(config: &HashMap<String, String>) 
-> std::io::Result<()> 
{ 
// 创建 一 个 JSON 序 列 化 处 理 程序 将 数据 写 入 文件 
Let writer = File::create(config filename())?; 
Let mut serializer = serde_ json::Serializer::new(writer); 











// 剩 下 的 事 都 交 给 serde 的 .serialize() 方 法 处 理 
config.serialize(&mut serializer)?; 


Ok(()) 





} 
前 面 说 过 ， 在 实现 特 型 时 ， 相 关 的 特 型 或 类 型 必须 有 一 个 在 当前 包 中 是 新 的 。 这 叫 连贯 
规则 (coherence rule)。 这 个 规则 有 助 于 Rust 确保 特 型 实现 的 唯一 性 。 你 的 代码 中 不 用 写 
impl Write for u8， 就 是 因为 Write 和 vu8 都 在 标准 库 中 定义 了 。 如 果 Rust 包 都 这 样 写 ， 
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那 不 同 的 包 很 可 能 会 定义 u8 对 Write 的 不 同 实现 。 当 同时 使 用 这 些 包 时 ， 对 于 给 定 的 方法 
调用 ，Rust 也 没 办 法 判断 到 底 该 使 用 哪个 实现 。 


(C++ 有 一 个 类 似 的 唯一 性 限制 ， 叫 “一 次 定义 规则 ”。 在 典型 的 C++ 代码 中 ， 这 个 规则 
并 不 由 编译 器 强制 遵守 ， 因 此 除了 一 些 最 简单 的 情形 ， 否 则 破坏 这 个 规则 就 会 导致 未 定义 
行为 。) 


11.2.3 ” 特 型 中 的 SeLf 


特 型 可 以 使 用 关键 字 self 作为 类 型 。 比 如 ， 标 准 的 Clone 特 型 大 致 是 这 样 定义 的 〈 稍 有 
简化 ) : 


pub trait Clone { 
fn clone(&self) -> Self; 


} 
这 里 用 Self 作为 返回 类 型 意味 着 x.clone() 的 类 型 就 是 x 的 类 型 ， 不管 有 具体 什么 类 型 。 如 
果 x 是 String， 那 x.clone() 的 类 型 也 是 String， 而 不 是 Clone 或 其 他 实现 Clone 的 类 型 。 
类 似 地 ， 如 果 像 下 面 这 样 定义 了 一 个 特 型 : 


pub trait Spliceable { 
fn splice(&self, other: &Self) -> Self; 

















} 
而 它 有 两 个 实现 : 
impl Spliceable for CherryTree { 
fn splice(&self, other: &Self) -> Self { 


} 
} 


impl Spliceable for Mammoth { 
fn splice(&self, other: &Self) -> Self { 


} 
} 


那么 在 第 一 个 impl 块 中 ，Self 其 实 是 CherryTree 的 别名 ， 而 在 第 二 个 impl 块 中 ，Self 是 
Mammoth 的 别名 。 这 意味 着 可 以 把 两 棵 樱桃 树 (cherry tree) 嫁接 在 一 起 ， 也 可 以 让 两 头 猛 
独 象 (mammoth) 喜 结 连理 。 但 是 不 能 把 樱桃 树 和 猛 独 象 弄 到 一 块 去 。 换 名 话说，seLf 和 
other 的 类 型 必须 完全 一 样 。 
使 用 self 类 型 的 特 型 与 特 型 目标 不 能 共存 : 

// 错误 : 特 型 spliceable 不 能 成 为 引用 目标 


fn spLice_anything(Left: &Spliceable, right: &Spliceable) { 
let combo = left.splice(right); 
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随 着 越 来 越 多 地 使 用 特 型 的 高 级 特性 ， 就 能 越 来 越 清楚 这 是 为 什么 。Rust 拒绝 这 种 代码 ， 
因为 它 没 办 法 对 left.splice(right) 调用 做 类 型 检查 。 特 型 目标 的 核心 在 于 类 型 到 运行 时 
才能 知道 。 而 在 编译 时 ，Rust 没 办 法 判断 Left 和 right 是 不 是 同一 种 类 型 。 

特 型 目标 实际 上 针对 的 是 最 简单 的 特 型 ， 这 种 特 型 可 以 使 用 Java 中 的 接口 或 者 C++ 中 的 
抽象 基 类 实现 。 特 型 的 更 高 级 的 特性 很 有 用 ， 但 不 能 与 特 型 目标 共存 ， 因 为 在 它们 的 特 型 
目标 中 没有 Rust 做 类 型 检查 所 需 的 类 型 信息 。 


好 了 ， 如 有 果 就 想 实现 基因 上 不 可 能 人 工 进化 ， 那 么 可 以 这 样 设计 一 个 目标 友好 的 特 型 ; 


pub trait MegaSpliceable { 
fn splice(&self, other: &MegaSpliceable) -> Box<MegaSpliceable>; 
) 


这 个 特 型 与 特 型 目标 兼容 ， 因 为 调用 .spttce() 方法 时 ，other 参数 的 类 型 不 必 跟 setf 的 
类 型 完全 一 样 ， 只 要 两 者 的 类 型 都 是 MegasptLtceabte 就 可 以 通过 类 型 检查 。 


11.2.4 子 特 型 
可 以 将 一 个 特 型 声明 为 另 一 个 特 型 的 扩展 : 


/// 游戏 世界 中 的 角色 ， 可 以 是 玩家 或 者 其 他 什么 小 精灵 、 滴 水 兽 、 
/// 小 松鼠 、 食 人 魔 ， 等 等 
trait Creature: Visible { 

fn position(&self) -> (i32, i132); 

fn facing(&self) -> Direction; 





























} 


这 里 的 trait Creature: Visible 意味 着 所 有 角色 都 是 可 见 的 。 为 此 ， 所 有 实现 Creature 
的 类 型 ， 必 须 也 实现 Visible 特 型 ; 


impl Visible for Broom { 
} 


impl Creature for Broom { 


} 
为 一 个 类 型 实现 这 两 个 特 型 的 顺序 并 不 重要 ， 但 只 实现 Creature 不 实现 Visible 是 错误 的 。 


子 特 型 类 似 Java 或 C# 中 的 子 接口 ， 是 一 个 特 型 要 用 另外 几 个 方法 扩展 已 有 特 型 的 表达 
方式 。 对 于 上 面 这 个 例子 而 言 ， 所 有 与 角色 (Creature) 有 关 的 代码 ， 也 可 以 使 用 来 自 
Visible 特 型 的 方法 。 


11.2.5 ”静态 方法 


在 大 多 数 面 向 对 象 语言 中 ， 接 口 不 能 包含 静态 方法 或 构造 国 数 。 然 而 ，Rust 特 型 可 以 包含 
静态 方法 和 构造 函数 ， 语 法 如 下 : 



































trait StringSet { 
/// 返回 一 个 新 的 空 集合 
fn new() -> Self; 





/// 返回 一 个 包含 strings 中 所 有 字符 串 的 集合 
fn from slice(strings: &[&str]) -> Self; 


/// 确定 当前 集合 是 否 包含 特定 的 value 
fn contains(&self, string: &str) -> bool; 


/// 向 当前 集合 中 添加 一 个 字符 串 
fn add(&mut self, string: &str); 





} 


所 有 实现 Stringset 特 型 的 类 型 都 必须 实现 这 4 个 关联 函数 ， 其 中 ， 前 两 个 函数 new() 和 
from_slice() 不 接收 self 参数 。 它 们 充当 构造 函数 。 


在 非 泛 型 代码 中 ， 这 些 函 数 可 以 使 用 :: 语法 调用 ， 就 跟 调用 其 他 静态 方法 一 样 : 


// 创建 两 个 实现 了 StringSet 的 假设 类 型 的 集合 : 
let set1 = SortedStringSet::new(); 
Let set2 = HashedStringSet::new(); 


在 泛 型 代码 中 ， 其 实 也 差不多 ， 区 别 在 于 类 型 通常 是 可 变 的 ， 如 下 面 对 5: :new() 的 调用 所 示 : 
/// 返回 document 中 不 在 wordlist 中 的 词 的 集合 


fn unknown_words<S: StringSet>(document: &Vec<String>, wordlist: &S) -> S{ 
let mut unknowns = S::new(); 
for word in document { 
if !wordlist.contains(word) { 
unknowns .add(word); 























+ 
} 


unknowns 


} 


与 Java 和 C# 的 接口 类 似 ， 特 型 目标 不 支持 静态 方法 。 如 果 想 要 使 用 特 型 目标 &StringSet， 
就 必须 修改 特 型 ， 给 每 个 静态 方法 都 添加 where Self: Sized 绑 定 : 
trait StringSet { 


fn new() -> Self 
where Self: Sized; 


fn from slice(strings: &[&str]) -> Self 
where Self: Sized; 


fn contains(&self, string: &str) -> bool; 


fn add(&mut self, string: &str); 
} 


这 个 绑 定 告诉 Rust: 特 型 目标 将 免 于 支持 这 个 方法 。 然 后 ， 就 可 以 使 用 &Stringset 特 型 
目标 了 。 特 型 目标 仍然 不 支持 两 个 静态 方法 ， 但 你 可 以 创建 它们 并 用 于 调用 .contaiins() 
和 .add()。 同 样 的 做 法 也 适用 于 任何 其 他 不 兼容 特 型 目标 〈 不 能 与 特 型 目标 共存 ) 的 方 
法 。( 这 里 就 不 解释 为 什么 这 样 能 行 的 技术 细节 了 ， 不 过 第 13 章 会 介绍 Sized 特 型 。) 
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11.3 ”完全 限定 方法 调用 
方法 其 实 就 是 一 种 特殊 的 函数 。 以 下 两 种 方法 调用 是 等 价 的 


"heLtLto" .to_string() 














str::to_string("hello") 


第 二 种 形式 看 起 来 就 是 一 个 静态 方法 调用 。 即 使 to_string 方法 接收 self 参数 ， 这 样 调用 
也 没有 问题 。 只 要 把 self 作为 函数 的 第 一 个 参数 传 给 它 即 可 。 


由 于 to_string 是 标准 Tostring 特 型 的 方法 ， 因 此 还 有 两 种 形式 可 以 使 用 : 


ToString::to_string("hello") 





<str as ToString>::to_string("hello") 
以 上 4 种 方法 调用 都 完成 同样 的 操作 。 一 般 情况 下 ， 还 是 value.method() 这 种 形式 用 的 比 
较 多 。 其 他 形式 称 为 限定 方法 调用 ， 因 为 它们 需要 指定 方法 关联 的 类 型 或 特 型 。 最 后 一 种 
带 尖 括号 的 形式 ， 则 同时 指定 了 两 者 ， 因 此 称 为 完全 限定 方法 调用 。 
在 "hello".to_string() 这 种 形式 中 ， 使 用 的 是 . 操作 符 ， 并 没有 确切 说 明 要 调用 的 是 哪 
个 to_string 方法 。Rust 会 通过 一 个 方法 查询 算法 去 找 ， 根 据 类 型 、 强 制 解 引用 (deref 
coercion) 等 来 判断 。 完 全 限定 调用 要 确切 指定 使 用 的 方法 ， 这 在 一 些 边界 情况 下 很 有 用 。 
。 两 个 方法 同名 。 经 典 的 例子 是 从 两 个 不 同 特 型 得 到 两 个 .draw() 方法 的 0utlaw， 其 中 一 
个 可 以 把 它 绘 制 到 屏幕 上 ， 另 一 个 用 于 挑战 法 律 。 


outlaw.draw(); // 错误 : 绘制 到 屏幕 还 是 开 枪 ? 























Visible::draw(&outlaw); // 可 以 : 绘制 到 屏幕 
HasPistoL: :draw(&outLaw); // 可 以 : 抓 住 他 


正常 情况 下 应 该 有 机 会 重 命名 其 中 一 个 方法 ， 但 有 时 候 确 实 不 行 。 
。 无 法 推断 self 参数 的 类 型 。 


let zero = 6; // 类 型 未 指定 ， 可 能 是 18、u8.…… 








zero.abs(); // 错误 : 没有 找到 abs 方 法 
i64: :abs(zero); // 可 以 


。 将 函数 本 身 作为 值 。 


Let words: Vec<String> = 
line.split_whitespace() // 产生 &str 值 的 迭代 器 
.map(<str as ToString>::to_string) // 可 以 
.Collect(); 


这 里 的 完全 限定 形式 <str as ToString>::to_string 就 是 一 种 给 传人 :map 的 函数 命名 
的 方式 。 








。 在 宏 里 调用 特 型 方法 。 第 20 章 将 解释 。 
完全 限定 语法 也 适用 于 静态 方法 。 上 一 节 用 $::new() 在 一 个 泛 型 函数 中 创建 了 一 个 新 集 
合 。 实 际 上 也 可 以 写成 StringSet::new() 或 <S as StringSet>::new()。 


11.4 定义 类 型 关系 的 特 型 
到 目前 为 止 ， 本 书 介绍 的 每 一 种 特 型 似乎 都 是 独立 的 : 特 型 是 类 型 可 以 实现 的 一 组 方法 。 
实际 上 ， 在 需要 多 个 类 型 相互 协作 的 情况 下 ， 特 型 同样 能 派 上 用 场 ， 因 为 特 型 可 以 用 来 描 
述 类 型 之 间 的 关系 。 
std: :iter::Iterator 特 型 通过 自己 产生 值 的 类 型 将 不 同 的 迭代 器 类 型 关联 起 来 。 
std: :ops: :Mul 特 型 关联 可 以 参与 乘法 运算 的 类 型 。 在 表达 式 a * b 中 ,a 和 b 这 两 个 值 
的 类 型 可 以 相同 ， 也 可 以 不 同 。 
rand 包 中 既 包含 一 个 跟随 机 数 生成 器 有 关 的 特 型 (rand: :Rng) ， 还 包含 一 个 与 能 够 被 随 
机 生成 的 类 型 有 关 的 特 型 (rand: :Rand)。 这 两 个 特 型 实际 上 就 定义 了 实现 它们 的 类 型 
之 间 的 协作 关系 。 
平时 做 开发 并 不 需要 经 常 创建 类 似 这 样 的 特 型 。 问 题 是 你 在 使 用 标准 库 和 第 三 方 包 的 时 
候 ， 总 会 看 到 它们 的 身影 。 因 此 本 节 就 来 分 析 一 下 上 面 每 个 例子 背后 的 实现 ， 然 后 在 分 析 
过 程 中 顺便 也 把 相关 的 Rust 语言 特性 介绍 一 下 。 关 键 是 要 培养 自己 阅读 特 型 和 方法 签名 的 
能 力 ， 做 到 一 看 就 知道 它们 对 相关 类 型 有 什么 要 求 。 


11.4.1 关联 类 型 (或 迭代 器 工作 原理 ) 

先 从 迭代 器 开始 吧 。 现 在 ， 几 乎 所 有 面向 对 象 语言 都 会 内 置 支持 某 种 形式 的 迭代 器 。 所 谓 
迭代 器 ， 就 是 一 个 能 够 通过 它 遍 历 一 系列 值 的 对 象 。 

Rust 有 一 个 标准 的 Iterator 特 型 ， 定 义 如 下 : 


pub trait Iterator { 
type Item; 




















fn next(&mut self) -> Option<Self::Item>; 


} 


这 个 特 型 的 第 一 个 特性 type Item; 是 一 个 关联 类 型 (associated type)。 所 有 实现 Iterator 
的 类 型 都 必须 指定 自己 产生 的 项 (item) 的 类 型 。 

第 二 个 特性 是 next() 方法 ,在 返回 值 中 使 用 了 这 个 关联 类 型 。next() 返回 一 个 Option<Self 
::Item>， 即 要 么 是 Some(item)， 其 中 iten 是 序列 中 的 下 一 个 值 ， 要 么 是 None， 表 明 已 经 
没有 更 多 值 了 。 这 个 类 型 写作 self::Item， 而 不 是 单纯 的 Item， 是 因为 Item 是 每 个 迭代 
器 类 型 的 特性 ， 而 不 是 某 个 独立 类 型 的 特性 。 一 如 既往 ，self 和 Self 类 型 在 代码 中 依旧 
会 出 现在 它们 的 字段 、 方 法 等 被 用 到 的 地 方 。 

下 面 来 看 一 个 实现 Iterator 的 类 型 : 
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// (截取 自 std: :env 标 准 库 模块 的 代码 ) 

impL Iterator for Args { 
type Item = String; 
fn next(&mut self) -> Option<String> { 
} 


} 


std: :env::Args 是 标准 库 国 数 std: :env::args() 返回 的 迭代 器 类 型 ， 第 2 章 曾 使 用 它 访问 
过 命令 行 参 数 。 这 个 友 代 器 产生 String 值 ， 因 此 impl 块 声 明了 type Item = String;。 


泛 型 代码 可 以 使 用 关联 类 型 : 

















UD 


/// 遍历 一 个 迭代 器 ， 将 它们 的 值 存 储 到 一 个 新 向 量 
fn coLLect_into_vector<I: Iterator>(iter: I) -> Vec<I::Item> { 
Let mut results = Vec::new(); 
for value in iter { 
results.push(value); 





} 


results 


} 


在 这 个 函数 体内 ，Rust 会 为 我 们 推断 vatue 的 类 型 ， 这 当然 很 好 。 不 过 ， 我 们 必须 写 


出 collect_into_vector 的 返回 值 类 型 ， 而 关联 类 型 Tten 是 描述 返回 值 类 型 的 唯 

















(Vec<I> 肯定 不 对 ， 这 样 就 是 声明 返回 选 代 器 向 量 了 ! ) 


前 面 例子 中 的 代码 并 不 需要 自己 编写 ， 看 完 第 15 章 之 后 你 会 知道 欠 代 器 已 经 有 了 一 个 实 
现 同样 操作 的 标准 方法 : iter.collect()。 既 然 说 到 这 儿 了 ， 那 索性 就 多 看 一 个 例子 ， 然 





后 

















再 往 下 讲 。 


/// 打印 出 一 个 迭代 器 产生 的 所 有 值 

fn dump<I>(iter: I) 
where I: Iterator 

{ 
for (index, value) in iter.enumerate() { 

println!1("{}: {:?}"，index,，value); // 错误 

} 

} 


其 实 就 差 一 点 。 这 里 只 有 一 个 问题 ，vatue 可 能 不 是 可 打印 类 型 。 


error[E0277]: the trait bound ‘<I as std::iter::Iterator>::Itenm: 
std::fmt::Debug. is not satisfied 
--> traits_dump.rs:10:37 

| 
10 | println!i("{}: {:?}"，index, value);  // 错误 

| ^^A^AA^ the trait ‘std::fmt::Debug. 

| is not implemented for 
| ‘<I as std::iter::Iterator>::Item 
| 


help: consider adding a 
‘where <I as std::iter::Iterator>::Item: std::fmt::Debug” bound 
= note: required by ‘std::fmt::Debug::fmt. 


方式 。 
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由 于 Rust 使 用 了 <I as std::iter::Iterator>::Iten 这 种 语法 ， 导 致 上 面 的 报错 信息 不 太 
好 理解 。 其 实 这 是 表达 I: :Iten 的 最 长 、 最 明确 的 形式 。 虽 然 是 有 效 的 Rust 语法 ， 但 实际 
上 很 少 需要 这 样 写 。 

报错 消息 的 要 点 在 于 ， 如 果 想 让 泛 型 函数 通过 编译 ， 那 必须 保证 I: :Iten 实现 Debug 特 型 ， 
也 就 是 以 {:?} 来 格式 化 值 的 特 型 。 为 此 ， 可 以 在 I::Item 上 增加 一 个 绑 定 : 


use std::fmt::Debug; 























fn dump<I>(iter: I) 
where I: Iterator, I::Item: Debug 


{ 
} 
或 者 ， 也 可 以 声明 “I 必须 是 一 个 遍历 String 值 的 迭代 器 ”: 


fn dump<I>(iter: I) 
where I: Iterator<Item=String> 


{ 
} 


这 里 的 Iterator<Item=String> 本 身 就 是 一 个 特 型 。 如 果 认 为 Iterator 是 所 有 迭代 器 类 
型 的 一 个 集合 ， 那 么 Iterator<Item=String> 就 是 Iterator 的 一 个 子 集 ， 即 产生 String 
的 返 代 器 类 型 的 集合 。 在 任何 可 以 使 用 特 型 名 字 的 地 方 都 可 以 使 用 这 种 语法 ， 包 括 特 型 
目标 类 型 : 

fn dump(iter: &mut Iterator<Item=String>) { 


for (index, s) in iter.enumerate() { 
println!("{}: {:?}", index, s); 


} 


像 Iterator 这 种 带 有 关联 类 型 的 特 型 是 可 以 与 特 型 方法 共存 的 ， 但 前 提 是 必须 把 所 有 关 
联 类 型 都 明确 写 出 来 ， 就 像 示 例 中 所 展示 的 那样 。 否 则 ， 这 个 示例 中 的 s 就 可 以 是 任意 类 
型 ， 于 是 Rust 就 没 办 法 对 代码 做 类 型 检查 了 。 


前 面 已 经 展示 了 很 多 和 迭 代 器 的 例子 。 事 实 上 ， 也 很 难 不 举 这 些 例子 ， 毕 竞 关 联 类 型 最 重要 

的 用 武之 地 就 是 迭代 器 。 不 过 ， 关 联 类 型 本 身 在 特 型 需要 窗 盖 除 方法 之 外 的 定义 时 也 是 很 

有 用 的 。 

。 一 个 线程 池 的 库 中 的 Task 特 型 (表示 工作 单元 )， 可 以 包含 一 个 关联 的 0utput 类 型 。 

。 一 个 Pattern 特 型 (表示 搜索 字符 串 的 一 种 方式 )， 可 以 包含 一 个 关联 的 Match 类 型 ， 
表示 模式 与 字符 串 匹配 之 后 收集 到 的 所 有 信息 。 


trait Pattern { 
type Match; 





























fn search(&self, string: &str) -> Option<Self::Match>; 
} 
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/// 可 以 在 字符 串 中 搜索 特定 的 字符 
impl Pattern for char { 
/// Match (匹配 ) 表示 的 就 是 发 现 字符 的 位 置 


type Match = usize; 








fn search(&self, string: &str) -> Option<usize> { 


} 
3 

如 果 熟 悉 正 则 表达 式 ， 很 容易 看 出 来 impl Pattern for RegExp 应 该 可 以 把 Match 类 型 

声明 为 一 个 更 复杂 的 类 型 ， 比 如 一 个 包含 匹配 起 止 位 置 、 捕 获 组 位 置 等 信息 的 结构 体 。 
。 一 个 操作 关系 数据 库 的 库 可 以 有 一 个 DatabaseConnection 特 型 ， 而 这 个 特 型 可 以 有 表示 

事务 、 指 针 、 初 始 化 语句 等 的 关联 类 型 。 
关联 类 型 非常 适合 每 个 实现 都 有 一 个 特定 的 相关 类 型 的 情况 。 比 如 ， 每 个 Task 类 型 产生 一 
个 特定 的 0utput 类 型 ， 每 个 Pattern 类 型 查找 一 个 特定 的 Match 类 型 。 然 而 ， 马 上 要 看 到 
的 类 型 间 的 某 些 关系 并 不 是 这 样 的 。 


11.4.2” 泛 型 特 型 (或 操作 符 重 载 的 原理 ) 
Rust 中 的 乘法 运算 使 用 这 个 特 型 : 


/// std: :ops::Mul， 支 持 * 操 作 符 的 类 型 实现 的 特 型 
pub trait Mul<RHS> { 

/// 应 用 * 操 作 符 之 后 返回 的 结果 类 型 

type Output; 

















/// * 操 作 符 对 应 的 方法 
fn mul(self, rhs: RHS) -> SeLf: :Output; 
} 

Mul 是 一 个 泛 型 特 型 。 类 型 参数 RHS 是 Right Hand Side (右手 边 ) 的 简写 形式 。 
类 型 参数 在 这 里 的 含义 与 它 在 结构 体 或 者 函数 中 的 含义 相同 。 具 体 来 说 ，Mul 是 一 个 泛 型 
特 型 ， 其 实例 Mul<f64>、Mul<String>、Mul<Size> 等 ， 都 是 不 同 的 特 型 ， 就 像 min: :<i32> 
和 min: :<String> 是 不 同 的 函数 ，Vec<i32> 和 Vec<String> 是 不 同 的 类 型 一 样 。 
一 个 类 型 ， 比 如 WindowSize， 可 以 既 实 现 MuL<f64> 又 实现 Mul<i32>， 其 至 实现 更 多 。 然 
后 ， 就 可 以 将 一 个 Windowsize 跟 很 多 其 他 类 型 相 乘 了 。 每 个 实现 都 会 有 自己 关联 的 Output 
类 型 。 
上 面 代 码 中 展示 的 特 型 少 了 一 个 小 细节 。 真 正 的 Mul 特 型 是 这 样 的 : 


pub trait Mul<RHS=Self> { 








} 


语法 RHS=Self 的 意思 是 RHS 默认 为 SeLf。 如 果 我 写 impL Mul for Complex， 不 指定 Mul 
的 类 型 参数 ， 那 就 相当 于 写 的 是 impl Mul<Complex> for Complex。 在 绑 定 中 ， 如 果 我 写 
where T: MuL， 则 相当 于 写 的 是 where T: MuL<T>。 
































Ba 


在 Rust 中 ， 表 达 式 ths * rhs 是 MuL: :muL(Lhs，rhs) 的 简写 形式 。 
操作 符 和 实现 Mul 特 型 一 样 简 单 。 有 具体 的 例子 下 一 章 会 详细 介绍 。 


11.4.3” 伴 型 特 型 (或 rand: :random() 工 作 原 理 ) 

还 有 一 种 使 用 特 型 表达 类 型 之 间 关 系 的 方式 。 这 种 方式 可 能 是 最 简单 的 ， 因 为 理解 它 不 必 
学 习 任 何 新 的 语言 特性 。 这 里 所 说 的 伴 型 特 型 (buddy trait) ， 其 实 就 是 设计 用 来 协同 工作 
的 特 型 。 

颇 受 欢迎 的 生成 随机 数 的 rand 包 中 有 一 个 不 错 的 例子 。rand 的 主要 功能 是 random() 国 数 ， 
它 返 回 一 个 随机 值 : 


use rand: :random; 
Let x = random(); 


如 果 Rust 无 法 推断 随机 值 的 类 型 (经 常会 有 这 种 情况 )， 那 你 必须 指定 : 


Let x = random::<f64>(); // 数值 , 0.0 <x<1.0 
let b = random::<bool>(); // true 或 false 


对 于 很 多 程序 来 说 ， 这 种 泛 型 函数 就 足够 了 。 不 过 rand 包 中 也 提供 了 几 种 不 同 但 可 以 互 操 
作 的 随机 数 生成 器 。 这 个 包 中 的 所 有 随机 数 生 成 器 都 实现 了 一 个 公共 特 型 : 


/// 一 个 随机 数 生成 器 
pub trait Rng { 
fn next_U32(&mut self) -> uy32; 





此 ， 在 Rust 中 重 载 * 





























} 


Rng 就 是 一 个 可 以 根据 需求 输出 整数 的 值 。rand 包 提 供 了 几 种 对 它 不 同 的 实现 ， 包 括 
XorShiftRng (一 个 快速 伪 随 机 数 生成 器 ) 和 0sRng (要 慢 得 多 ， 但 真 的 无 法 预测 ， 用 于 加 密 )。 


这 里 用 到 的 伴 型 特 型 叫 Rand: 


/// 可 以 使 用 Rng 随 机 生成 的 类 型 
pub trait Rand: Sized { 

fn rand<R: Rng>(rng: &mut R) -> Self; 
} 


f64 和 bool 等 类 型 实现 了 这 个 特 型 。 给 它们 的 ::rand() 方法 传 入 任意 随机 数 生 成 器 ， 都 会 
生成 一 个 随机 值 : 

let x = f64::rand(rng); 

let b = bool::rand(rng); 
实际 上 ，random() 就 是 简单 包装 了 一 下 对 这 个 rand 方法 的 调用 ， 并 传 给 它 一 个 全 局 分 配 
的 Rng。 以 下 是 实现 它 的 一 种 方式 : 

pub fn random<T: Rand>() -> TT 


T::rand(&mut global_rng()) 
} 
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看 到 使 用 其 他 特 型 作为 绑 定 的 特 型 (也 就 是 Rand: :rand() 使 用 Rng 的 方式 )， 就 会 知道 这 
两 个 特 型 是 相辅相成 的 。 换 句 话说， 任意 Rng 可 以 生成 所 有 Rand 类 型 的 值 。 因 为 这 个 方法 
涉及 泛 型 ， 所 以 Rust 会 为 程序 中 用 到 的 每 种 Rng 与 Rand 的 组 合生 成 优化 的 机 器 码 。 


这 两 种 特 型 也 各 自 有 不 同 的 关注 点 。 如 图 11-3 所 示 ， 无 论 是 为 Monster 类 型 实现 Rand， 还 








是 实现 一 个 特别 快 但 没 那 么 随机 的 Rng， 都 不 必 操 心 它们 怎样 相互 配合 ， 除 了 实现 什么 也 
不 用 做 。 
实现 Rng 的 类 型 实现 Rand 的 类 型 
bool 
0SRng ~ 
EN 
XorShiftRng Rand 
f64 
lsaacRng 

(f32, f32) 











图 11-3: 伴 型 特 型 示意 图 。 左 侧 的 Rng 类 型 是 rand 包 提 供 的 真正 的 随机 数 生成 器 


标准 库 中 计算 散 列 码 的 实现 是 伴 型 特 型 的 另 一 个 例子 。 实 现 Hash 的 类 型 是 可 以 散 列 化 的 ， 因 
此 可 以 用 作 散 列表 的 键 。 实 现 Hasher 的 类 型 是 散 列 化 算法 。 这 两 个 特 型 以 跟 Rand 和 Rng 相同 
的 方式 连接 在 一 起 :Hash 有 一 个 泛 型 方法 Hash: :hash()， 接 收 任何 类 型 的 Hasher 作为 参数 。 


还 有 一 个 例子 是 serde 库 的 Serialize 特 型 ，11.2.2 节 曾 经 介绍 过 。 但 它 有 一 个 伴 型 特 型 前 
面 没 提 到 ， 就 是 Serializer 特 型 ， 它 表示 输出 格式 。serde 支持 可 插 拔 的 序列 化 格式 。 不 
同 的 Serializer 实现 了 JSON、YAML、 一 个 叫 CBOR 的 二 进 制 格式 ， 等 等 。 由 于 这 两 个 
特 型 之 间 的 紧密 协作 关系 ， 每 种 格式 都 自动 支持 每 种 可 序列 化 的 类 型 。 


最 后 这 3 市 讨论 了 用 特 型 描述 类 型 之 间 关系 的 3 种 方式 。 所 有 这 些 都 可 以 看 成 为 了 避免 虚 
拟 方法 消耗 和 向 下 转型 ， 因 为 它们 可 以 让 Rust 在 编译 时 知道 更 具体 的 类 型 。 


11.5 逆向 工程 绑 定 


如 果 没 有 一 个 特 型 可 以 满足 你 所 有 的 需求 ， 那 写 泛 型 代码 是 非常 困难 的 。 假 设 我 们 已 经 写 
了 下 面 这 个 非 泛 型 函数 以 实现 菜 些 计算 : 
fn dot(v1: &[i64], v2: &[i64]) -> i64 { 
let mut total = 0; 


for i in0 .. vi.len() { 
total = total + v1[i] * v2[i]; 














} 


total 


} 
现在 想 重用 同一 套 代 码 去 计算 浮 点 值 。 那 么 可 以 尝试 这 样 改 : 
fn dot<N>(v1: &[N]，v2: &[N]) -> N{ 


let mut total: N = 0; 
for i in0 .. vi.len() { 





total = total + vi[i] * v2[i]; 


} 
total 


} 


很 不 垃 ，Rust 会 抱怨 代码 中 使 用 了 + 和 *， 还 有 0 的 类 型 。 可 以 使 用 Add 和 Mul 特 型 ， 要 
求 N 是 一 个 支持 + 和 * 的 类 型 。 这 里 用 到 的 0 也 要 改 ， 因 为 Rust 中 的 0 始终 是 整数 ， 对 应 
的 浮 点 值 是 0.0。 这 里 恰好 有 一 个 标准 的 特 型 Default 可 以 让 有 默认 值 的 类 型 使 用 。 对 于 数 


值 类 型 ， 默 认 值 始终 为 0。 


use std::ops::{Add, Mul}; 








fn dot<N: Add + Mul + DefauLt>(v1: &[N], v2: &[N]) -> N{ 
let mut total = N::default(); 
for i in0 .. vi.len() { 
total = total + vi[i] * v2[i]; 


} 
total 


} 
已 经 很 接近 了 ， 但 还 是 差 那 么 一 点 : 


error[E0308]: mismatched types 
--> traits generic dot 2.rs:11:25 


| 
11 | total = total + v1[i] * v2[i]; 
| ^^^A^^A^^^^AAA^^ 人 expected type parameter, found associated type 


| 
= note: expected type N° 
found type ‘<N as std::ops::Mul>::0utput. 
我 们 的 新 代码 假设 乘 以 两 个 类 型 N 的 值 会 得 到 另 一 个 类 型 N 的 值 ， 但 这 可 是 不 一 定 的 。 此 
时 可 以 重 载 乘法 操作 符 返 回想 要 的 任何 类 型 。 我 们 需要 一 种 方式 告诉 Rust 这 个 泛 型 函数 只 
适用 于 常规 的 乘法 运算 ， 即 N * N 就 返回 N。 为 此 ， 要 把 Mul 替换 成 Mul<0utput=N>。Add 
也 采用 同样 的 改 法 。 
fn dot<N: Add<Output=N> + Mul<Output=N> + DefauLt>(v1: &[N], v2: &[N]) -> N 
{ 


} 


这 样 一 改 ， 加 入 了 很 多 绑 定 ， 代 码 的 可 读 性 立马 下 降 了 很 多 。 那 把 绑 定 转移 到 where 子 
句 中 : 


fn dot<N>(v1: &[N], v2: &[N]) -> N 
where N: Add<Output=N> + Mul<Output=N> + Default 
{ 


} 
不 错 。 但 Rust 依旧 抱怨 这 行 代 码 有 问题 : 
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error[E0508]: cannot move out of type“`[N] ` ，a non-copy array 
--> traits_generic_dot_3.rs:7:25 


| 
7 total = total + v1i[i] * v2[i]; 
| ^^A^^ cannot move out of here 


这 个 报错 可 真 难 理解 ， 就 算 我 们 都 已 经 熟悉 了 相关 概念 也 看 不 懂 。 没 错 ， 把 v1[i] 的 值 转 
移出 切片 是 不 合法 。 但 数值 不 是 可 复制 的 吗 ? 又 是 哪里 出 问题 了 ? 


答案 是 Rust 不 知道 vi[i] 是 一 个 数值 。 事 实 上 ， 它 确实 不 是 。 基 于 目前 给 出 的 绑 定 信息 ， 
N 可 能 是 任何 类 型 。 如 果 也 想 让 N 是 一 个 可 复制 类 型 ， 必 须 再 加 一 个 绑 定 : 


where N: Add<Output=N> + MUL<Output=N> + Default + Copy 
加 完 以 后 ， 代 码 就 可 以 编译 运行 了 。 最 终 代 码 如 下 所 示 : 


use std::ops::{Add, Mul}; 














fn dot<N>(v1: &[N], v2: &[N]) -> N 
where N: Add<Output=N> + Mul<Output=N> + Default + Copy 
{ 
let mut total = N::default(); 
for i in 0 .. vi.len() { 
total = total + v1i[i] * v2[i]; 


} 
total 
} 
#[test] 


fn test dot() { 
assert eq!(dot(&[1, 2, 3, 4], &[1, 1, 1, 1]), 10); 
assert_eq!(dot(&[53.0, 7.0], &[1.0, 5.0]), 88.0); 
} 


刚刚 这 个 情景 在 编写 Rust 程序 时 偶 有 发 生 : 先是 跟 编译 器 紧张 地 争论 一 番 ， 最 终 代码 变 成 
了 很 好 看 的 样子 ， 就 好 像 是 没 费 吹 灰 之 力 就 写 出 来 的 ， 而 且 运 行 得 也 很 “ 丝 清 。 

我 们 在 这 里 所 做 的 是 对 的 绑 定 进行 了 逆向 工程 ， 让 编译 器 当 指 导 ， 反 复 检查 自己 的 工 
作 。 之 所 以 这 个 过 程 有 点 痛苦， 主要 原因 是 标准 库 中 并 没有 那么 一 个 Number 特 型 ， 包 含 我 
们 想 要 使 用 的 所 有 操作 符 和 方法 。 真 是 无 巧 不 成 书 ， 有 一 个 流行 的 开源 Rust 包 叫 num， 它 
就 定义 了 这 么 一 个 特 型 ! 如 果 早 一 点 知道 ， 就 可 以 在 Cargo.toml 中 加 上 num， 然 后 这 样 写 : 


use num: :Num; 












































fn dot<N: Num + Copy>(v1: &[N], v2: &[N]) -> Nf{ 
Let mut total = N::zero(); 
for i in0 .. vi.len() { 
total = total + vi[i] * v2[i]; 
} 
total 


} 


就 像 在 面向 对 象 编程 中 一 样 ， 正 确 的 接口 能 让 一 切 变 美 好 。 而 在 泛 型 编程 中 ， 正 确 的 特 型 
能 让 一 切 变 美好 。 
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还 是 那个 问题 ， 为 什么 要 这 么 麻烦 呢 ?” 为 什么 Rust 的 设计 者 不 把 泛 型 设计 得 更 像 C++ 模 
板 ， 让 所 有 约束 都 隐 含 在 代码 中 ， 模 仿 “ 了 鸭 子 类 型 ”? 

Rust 的 这 种 设计 的 一 个 优点 是 可 以 让 泛 型 代码 具有 向 前 兼容 的 能 力 。 你 可 以 修改 一 个 公有 
泛 型 函数 或 方法 的 实现 ， 只 要 不 改变 签名 ， 就 不 会 给 它 的 任何 用 户 造 成 麻烦 。 

绑 定 的 另 一 个 优点 在 于 ， 你 能 通过 编译 器 报错 知道 要 解决 的 麻烦 在 哪里 。C++ 编译 器 涉及 
模板 的 错误 消息 要 比 Rust 的 长 很 多 ， 并且 会 指出 很 多 不 同 的 行 号 来 ， 因 为 编译 器 没 办 法 知 
道 对 于 发 生 的 问题 该 责怪 谁 。 是 模板 呢 ， 还 是 它 的 调用 者 ?而 调用 者 可 能 也 是 一 个 模板 ， 
当然 ， 那 个 模板 也 可 能 是 个 调用 者 …… 

或 许 ， 明 确 写 出 绑 定 最 重要 的 好 处 是 它们 在 代码 和 文档 里 都 存在 。 这 样 只 要 你 一 看 到 Rust 
泛 型 国 数 的 签名 ， 就 能 确切 知晓 它 接 收 什么 样 的 参数 。 使 用 模板 则 做 不 到 这 一 点 。 与 我 们 
在 这 里 经 历 的 挫折 相 比 ，Boost 之 类 的 C++ 库 要 完整 写 出 所 有 类 型 的 文档 ， 那 才 真 叫 受 罪 
呢 。 可 没有 编译 器 帮 Boost 的 开发 者 检查 它们 的 工作 。 


11.6 ”小 结 


特 型 是 Rust 中 一 种 主要 的 组 织 性 手段 ， 而 且 其 存在 有 充分 的 必要 性 。 设 计 程 序 或 库 最 重要 
的 就 是 设计 出 好 的 接口 。 
本 章 ， 我 们 经 历 了 一 波 语法 、 规 则 和 解释 的 轮番 冲击 。 如 果 你 仍然 屹立 不 倒 ， 那 么 接 下 来 
本 书 就 可 以 讨论 在 Rust 代码 中 使 用 特 型 和 泛 型 的 各 种 方式 了 。 人 悄悄 地 告诉 你 ， 本 章 只 不 
过 是 一 场 头 脑 风暴 的 前 奏 而 已 。 接 下 来 的 两 章 将 介绍 标准 库 提供 的 常用 特 型 。 之 后 的 各 
章 将 讨论 到 闭 包 、 迭 代 器 、 输 入 /输出 和 并 发 ， 而 特 型 和 泛 型 在 这 些 主题 中 都 扮演 了 重 
要 角色 。 
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第 12 章 


操作 符 重 载 





关于 数学 的 确切 范围 和 定义 ， 数 学 家 和 哲学 家 有 不 同 的 看 法 …… 但 他 们 的 看 法 者 
有 严重 的 问题 ， 没 有 得 到 广泛 接受 ， 看 起 来 也 没有 和 解 的 可 能 。 
一 一 维基 百科， 关于 “数学 ”的 定义 
第 2 章 在 绘制 曼 德 布 洛 特集 合 的 例子 中 使 用 了 nun 包 的 Complex 类 型 来 表示 复 平面 上 的 点 


#[derive(Clone, Copy, Debug)] 
struct Complex<T> { 
/// 复数 的 实数 部 分 











re: T， 
/// 复数 的 虚数 部 分 
im: T 


} 
使 用 Rust 的 + 和 * 操作 符 ， 可 以 像 计 算 内 置 数 值 类 型 一 样 对 Complex 值 进行 加 和 乘 : 
ZZ*Z+Cs 


你 也 可 以 让 自己 定义 的 类 型 支持 算术 和 其 他 操作 ， 只 要 实现 几 个 内 置 特 型 即 可 。 这 就 称 为 
操作 符 重 载 ， 其 效果 跟 C++、C#、Python 和 Ruby 中 的 操作 符 重 载 很 像 。 

操作 符 重 载 的 特 型 可 以 分 为 几 类 ， 有 具体 取决 于 它们 支持 Rust 语言 的 哪个 部 分 ， 如 表 12-1 
所 示 。 本 章 接 下 来 几 节 会 依次 介绍 这 几 类 特 型 。 
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表 12-1; 支持 操作 符 重 载 的 特 型 











类 别 特 型 操 作 符 
一 元 操作 符 std: :ops::Neg -x 
std: :ops: :Not 1X 
算术 操作 符 std: :ops: :Add x+y 
std::ops::Sub x-y 
std: :ops: :Mul x*y 
std: :ops: :Div x/y 
std: :ops: :Rem x%y 
位 操作 符 std: :ops: :BitAnd x&y 
std: :ops::Bitor XxX]|Yy 
std: :ops: :BitXor x^y 
std::ops::Shl x<<y 
std: :ops::Shr x >> y 
复合 赋值 std::ops::AddAssign X += y 
算术 操作 符 std: :ops: :SubAssign x -=y 
std: :ops: :MulAssign X *=y 
std: :ops: :DivAssign x/=y 
std: :ops: :RemAssign x%=y 
复合 赋值 std: :ops::BitAndAssign x&=y 
位 操作 符 std: :ops: :BitOrAssign x |=y 
std: :ops: :BitXorAssign XY 
std: :ops: :ShlAssign x <<= y 
std::ops::ShrAssign 3 
比较 std::cmp::PartialEq x==y、x!=y 
std::cmp::PartiaLOrd X<y、x<=y、 x>y、x>=y 
索引 std::ops::Index x[y]、&x[y] 
std::ops::IndexNMut x[y] = z、&mut x[y] 


12.1 算术 与 位 操作 符 


在 Rust 中 ， 表 达 式 a + b 实际 上 是 a.add(b) 的 简写 ， 即 这 是 对 标准 库 中 std: :ops: :Add 特 
型 的 add 方法 的 调用 。Rust 标准 的 数值 类 型 全 部 实现 了 std: :ops::Add。 为 了 让 表达 式 a + b 
能 够 用 于 Complex 值 ，num 包 也 为 Complex 实现 了 这 个 特 型 。 类 似 的 特 型 也 对 应 着 其 他 操作 
符 。 比 如 ，a * b 是 对 a.muL(b) 的 简写 ， 也 就 是 对 std: :ops::Mul 特 型 方法 的 调用 ， 同 理 ， 
std: :ops: :Neg 对 应 于 取 反 操作 符 -， 等 等 。 


如 果 非 要 写成 z.add(c) 的 形式 ， 那 需要 把 Add 特 型 引入 作用 域 ， 以 便 它 的 方法 可 见 。 这 样 
一 来 ， 就 可 以 把 所 有 算术 操作 当成 函数 调用 :， 


use std::ops::Add; 




















assert eq!(4.125f32.add(5.75), 9.875); 
assert_eq!(10.add(20)，10 + 20); 





注 1: Lisp 程序 员 很 高 兴 。 表 达 式 ::add 是 132 的 + 操作 符 ， 其 作为 函数 值 被 捕获 。 





以 下 是 std: :ops::Add 的 定义 : 


trait Add<RHS=SeLf> { 

type Output; 

fn add(self, rhs: RHS) -> Self::0utput; 
} 





换 句 话说 ， 特 型 Add<T> 代表 给 自己 的 类 型 加 上 一 个 T 值 的 能 力 。 比 如 ， 如 果 想 让 自己 的 


类 型 








可 以 加 i32 和 vu32 值 ， 那 你 的 类 型 必须 实现 Add<i32> 和 Add<u32>。 特 型 的 类 型 参数 





RHS 默认 值 为 self， 实 现 两 个 相同 类 型 值 的 加 法 比较 简单 ， 直 接 实 现 Add 就 行 。 关 联 类 型 
0utput 描述 相 加 的 结果 。 


比如 ， 为 了 实现 两 个 CompLex<i32> 值 相 加 ，CompLex<i32> 必须 实现 Add<Complex<i32>>。 
因为 是 在 同类 型 自身 基础 上 相 加 ， 所 以 只 需 写 Add: 


当然 ， 


Add。 
现 ， 


一 个 





use std::ops::Add; 


impl Add for Complex<i32> { 
type Output = Complex<i32>; 
fn add(self, rhs: Self) -> Self { 
Complex { re: self.re + rhs.re, im: self.im + rhs.im } 


} 


没 必要 分 别 为 Complex<i32>、Complex<i64>、Complex<f32>、Complex<f64> 单独 实现 
因为 它们 除了 类 型 不 一 样 ， 其 他 定义 都 相同 ， 所 以 应 该 可 以 只 写 一 个 普 适 的 泛 型 实 














只 要 复数 组 件 本 身 支 持 相 加 就 行 : 


use std::ops::Add; 


impL<T> Add for CompLex<T> 
where T: Add<Output=T> 


type Output = Self; 


fn add(self, rhs: Self) -> Self { 
Complex { re: self.re + rhs.re, im: self.im + rhs.im } 


} 


写 入 where T: Add<0utput=T> 将 T 限制 为 可 以 与 自身 相 加 的 类 型 ， 而 相 加 产生 的 是 另 


T 值 。 这 个 限制 虽然 合理 ， 但 还 是 可 以 把 条 件 放宽 一 点 ， 毕 竟 Add 特 型 不 要 求 + 的 两 


个 操作 数 类 型 相同 ， 也 没有 限制 结果 类 型 。 而 最 宽松 的 泛 型 实现 莫 过 于 让 左 、 右 操作 数 的 
类 型 互 不 影响 ， 同 时 能 够 产生 一 个 包含 加 法 操作 所 得 到 组 件 类 型 的 Complex 值 : 





use std::ops::Add; 


impl<L, R, 0> Add<Complex<R>> for Complex<L> 
where L: Add<R, Output=0> 


{ 
type Output = Complex<0>; 
fn add(self, rhs: Complex<R>) -> SeLf::Output { 
Complex { re: self.re + rhs.re, im: self.im + rhs.im } 
} 
} 
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不 过 ， 实 践 中 Rust 倾向 于 避免 支持 混合 类 型 操作 。 因 为 类 型 参数 ! 必须 实现 Add<R， 
Output=0>， 所 以 上 [、R 和 0 通常 都 为 同一 类 型 。 原 因 很 简单 ， 不 太 可 能 有 那么 多 类 型 让 上 
全 都 实现 了 。 最 终 ， 这 个 最 宽松 的 泛 型 函数 可 能 也 不 会 比 前 面 那个 更 简单 的 版 本 更 有 用 。 


Rust 为 算术 和 位 操作 符 而 内 置 的 特 型 分 为 3 组 : 一 元 操作 符 、 二 元 操作 符 和 复合 赋值 操作 
符 。 在 每 一 组 中 ， 特 型 及 其 方法 都 有 相同 的 形式 ， 因 此 接 下 来 每 组 会 举 一 个 例子 。 


12.1.1 一 元 操作 符 


除了 将 在 13.5 节 单 独 介 绍 的 引用 操作 符 *，Rust 还 有 两 种 一 元 操作 符 可 以 让 我 们 自 定义 ， 
如 表 12-2 所 示 。 


表 12-2: 一 元 操作 符 的 内 置 特 型 



























































特 型 名 表 达 式 等 价 表达 式 
std: :ops::Neg -x x.neg() 
std: :ops: :Not Ix x.not() 





Rust 的 所 有 数值 类 型 都 实现 了 std: :ops::Neg， 以 支持 一 元 取 反 操作 符 -。 整 数 类 型 和 bool 
还 实现 了 std::ops::Not， 以 支持 一 元 非 操 作 符 !。 同 时 ， 它 们 也 实现 了 对 这 些 类 型 的 
引用 。 
注意 ，! 操作 符 对 bool 值 取 非 ， 对 整数 执行 按 位 非 〈 即 按 位 反 转 )， 相 当 于 C 和 C++ 中 
的 ! 和 ~ 这 两 个 操作 符 。 
这 两 个 特 型 的 定义 很 简单 : 

trait Neg { 

type Output; 


fn neg(self) -> Self::0utput; 
} 














trait Not { 

type Output; 

fn not(self) -> Self::0utput; 
} 


对 复数 值 取 反 就 是 简单 地 对 其 每 个 组 件 取 反 。 以 下 是 对 Complex 值 取 反 的 一 个 泛 型 实现 : 


use std::ops::Neg; 

















impl<T, 0> Neg for Complex<T> 
where T: Neg<Output=0> 
{ 
type Output = Complex<0>; 
fn neg(self) -> Complex<0> { 
Complex { re: -self.re, im: -self.im } 


} 
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12.1.2 ”二 元 操作 符 
Rust 二 元 算术 和 位 操作 符 及 它们 对 应 的 内 置 特 型 如 表 12-3 所 示 。 
表 12-3: 二 元 操作 符 的 内 置 特 型 





类 别 特 型 名 表 达 式 等 价 表达 式 

算术 操作 符 std: :ops: :Add x+y x.add(y) 
std::ops::Sub X - y x.sub(y) 
std: :ops: :Mul x*y x.mul(y) 
std: :ops: :Div xX/Y x.div(y) 
std: :ops: :Rem x%y x.rem(y) 

位 操作 符 std: :ops: :BitAnd x&y x.bitand(y) 
std's0psy Bitor x|y x.bitor(y) 
std: :ops: :BitXor XtYy x.bitxor(y) 
std: :ops::ShL X << y x.shl(y) 
std: :ops::Shr x>>y x.shr(y) 


Rust 的 所 有 数值 类 型 都 实现 了 算术 操作 符 。Rust 的 整数 类 型 和 bool 实现 了 位 操作 符 。 当 

然 ， 它 们 也 实现 了 接受 对 这 些 类 型 的 引用 作为 一 个 或 两 个 操作 数 的 逻辑 。 

所 有 上 述 特 型 都 有 统一 的 形式 。 比 如 ， 针 对 ^ 操作 符 的 std: :ops: :BitXor 的 定义 如 下 : 
trait BitXor<RHS=Self> { 


type Output; 
fn bitxor(self, rhs: RHS) -> Self::O0utput; 





} 
本 章 开头 也 展示 了 同类 别 的 另 一 个 特 型 std: :ops::Add， 以 及 几 个 简单 的 实现 。 
特 型 shl 和 Shr 跟 这 个 模式 稍微 有 点 不 同 : 它们 没有 默认 指定 RHS 类 型 参数 的 值 为 self， 
因此 重新 实现 时 必须 明确 给 出 右 操作 数 的 类 型 。<< 和 >> 操作 符 的 右 操作 数 代 表 移 多 少 位 ， 
跟 要 移 位 的 值 的 类 型 没 太 大 关系 。 
使 用 + 操作 符 可 以 将 一 个 String 和 一 个 &str 切片 或 另 一 个 String 拼接 起 来 。 但 是 ，Rust 
不 允许 + 的 左 操作 数 是 &str， 目 的 是 阻止 通过 重复 小 的 左 操 作 数 来 构建 长 字符 串 。( 这 种 
操作 存在 性 能 隐患 ， 所 需 时 间 与 最 终 字 符 串 长 度 的 平方 正 相 关 。) 通常 ， 要 一 段 一 段 地 拼 
接 字符 串 ， 最 好 使 用 write! ，17.3.3 节 将 介绍 怎么 做 。 


12.1.3 复合 赋值 操作 符 

复合 赋值 表达 式 类 似 于 x += y 或 x &= y， 即 接受 两 个 操作 数 ， 先 对 它们 执行 加 法 或 按 位 
与 操作 ， 再 把 结果 保存 到 左 操作 数 中 。 在 Rust 中 ， 复 合 赋 值 表达 式 的 值 始终 是 ()， 而 不 
是 左 操 作 数 最 终 保存 的 值 。 

很 多 语言 有 类 似 的 操作 符 ， 且 通常 都 将 它们 定义 为 表达 式 x = x + y 或 x = x & y 的 简写 
形式 。 然 而 ，Rust 没有 遵循 这 个 惯例 。 在 Rust 中 ，x += y 是 方法 调用 x.add_assign(y) 的 
简写 形式 ， 其 中 add_assign 是 std: :ops::AddAssign 特 型 的 唯一 方法 。 
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trait AddAssign<RHS=SeLf> { 


fn add_assign(&mut self, RHS); 


} 


表 12-4 展示 了 Rust 的 所 有 复合 赋值 操作 符 ， 以 及 实现 它们 的 内 置 特 型 。 
表 12-4: 复合 赋值 操作 符 的 内 置 特 型 





类 别 特 型 名 Ea 等 价 表达 式 

算术 操作 符 std: :ops: :AddAssign x+=y x.add_assign(y) 
std: :ops::SubAssign x -= y x.sub_assign(y) 
std: :ops: :MulAssign X *=y x.mul_assign(y) 
std: :ops: :DivAssign x/=y x.div_assign(y) 
std: :ops: :RemAssign x %= y x.rem_assign(y) 

位 操作 符 std: :ops: :BitAndAssign x&=y x.bitand_assign(y) 
std: :ops::BitOrAssign x |=Y x.bitor_assign(y) 
std: :ops: :BitXorAssign XX = Yy x.bitxor_assign(y) 
std: :ops::ShlAssign x <<= y x.shl_assign(y) 
std: :ops::ShrAssign x >>= y x.shr_assign(y) 


Rust 的 所 有 数值 类 型 都 实现 了 算术 复合 赋值 操作 符 。Rust 的 整数 类 型 和 boot 3 


复合 赋值 操作 符 。 
对 Complex 类 型 进 


use std::ops: 


impl<T> AddAssign for Complex<T> 


于 AddAssign 的 泛 型 实现 也 很 简单 ; 


:AddAssign; 


where T: AddAssign<T> 


{ 


fn add_assign(&mut self, rhs: 


self.re += rhs.re; 
self.im += rhs.im; 


} 


Complex<T>) { 


还 实现 了 位 


复合 操作 符 的 内 置 特 型 与 对 应 的 二 元 操作 符 的 内 置 特 型 完全 是 相互 独立 的 。 实 现 


std: :ops::Add 不 会 自动 实现 std: :ops: 


作为 += 操作 符 的 左 操作 数 ， 就 必须 自己 实现 AddAssign。 
与 二 元 Shl 和 Shr 特 型 类 似 ，ShlAssign 和 ShrAssign 特 型 也 与 其 他 复合 赋值 特 型 不 太一 





12.2 ”相等 测试 


Rust 的 相等 操作 符 == 


和 != 是 对 调用 std: 


assert eq!(x == y, x.eq(&y)); 
assert eq!(x != y, x.ne(&y)); 


以 下 是 std: :cmp::PartiaLEq 的 定义 : 














:cmp: :PartialEq 特 型 的 方法 eq 和 ne 的 


:AddAssign。 如 果 你 想 让 Rust 允许 你 的 自 定 义 类 型 


样 : 它们 没有 将 RHS 类 型 参数 默认 为 Setf， 所 以 实现 时 必须 明确 给 出 右 操 作 数 的 类 型 。 


简写 : 


间 与 





trait PartialEq<Rhs: ?Sized = SeLf> { 

fn eq(&self, other: &Rhs) -> bool; 

fn ne(&self, other: &Rhs) -> bool { !self.eq(other) } 
} 


因为 ne 方法 有 一 个 默认 的 定义 ， 所 以 只 需 定义 eq 就 可 以 实现 PartialEq 特 型 。 下 面 是 
Complex 的 完整 实现 ， 
impl<T: PartialEq> PartialEq for CompLex<T> { 
fn eq(&self, other: &Complex<T>) -> bool { 
self.re == other.re && self.im == other.im 


} 
} 


换 名 话说 ， 对 于 任何 自身 可 以 比较 相等 的 组 件 类 型 T， 这 里 为 Complex<T> 实现 了 比较 。 假 
设 我 们 也 为 Complex 实现 了 std: :ops::MuL， 那 么 就 可 以 这 样 写 : 
Let x = Complex { re: 5, im: 2 }; 


Let y = Complex { re: 2, im: 5 }; 
assert eq!(x * y, Complex { re: 0, im: 29 }); 


partialEq 的 实现 基本 上 就 是 这 里 展示 的 形式 ， 即 同时 比较 左 操作 数 和 右 操作 数 的 每 个 对 
应 字段 。 这 个 实现 写 起 来 有 点 麻烦 ， 比 较 相 等 则 是 Rust 要 支持 的 常见 操作 ， 所 以 如 果 你 
求 ，Rust 会 为 你 自动 生成 PartialEq 的 实现 。 怎 么 要 求 呢 ?只 要 像 下 面 这 样 把 PartialEq 
添加 到 derive 属性 的 类 型 定义 中 即 可 : 


#[derive(Clone, Copy, Debug, PartialEq)] 
struct Complex<T> { 











3 


Rust 自动 生成 的 实现 与 我 们 手工 编写 的 代码 基本 相同 ， 都 是 依次 比较 相应 类 型 的 每 个 字段 
或 元 素 。Rust 也 可 以 为 enum 类 型 派生 PartialEq 实现 。 自 然 地 ， 这 个 类 型 拥有 (或 者 对 
enun 而 言 是 可 能 拥有 ) 的 每 个 值 自 身 也 必须 实现 PartiaLEq。 


与 算术 或 位 操作 相关 的 特 型 会 取得 操作 数 的 值 ， 但 PartialEq 会 取得 操作 数 的 引用 。 这 意 
味 着 对 String、Vec 或 HashMap 等 非 Copy 值 的 比较 不 会 导致 它们 的 值 转移 ， 而 这 可 能 会 带 
来 麻烦 : 

Let s = "d\x6fv\x65t\x61i\x6c".to_string(); 


Let 七 = "\x640\x76e\x74a\x691".to_string(); 
assert1(s == t); // s 和 t 在 此 只 是 被 借用 …… 


A 因此 在 这 里 它们 仍然 拥有 自己 的 值 
assert eq!(format!("{} {}", s, t), "dovetail dovetail"); 


这 里 就 不 得 不 提 到 这 个 特 型 对 Rhs 类 型 参数 的 绑 定 了 ， 这 种 类 型 参数 是 之 前 没 见 过 的 : 
Rhs: ?Sized 
这 样 写 相 当 于 放宽 了 Rust 对 类 型 参数 必须 有 大 小 的 限制 ， 因 而 才能 写 出 PartialEq<str> 


或 partiatEq<[T]> 这 样 的 特 型 。 方 法 eq 和 ne 接收 &Rhs 类 型 的 参数 ， 比 较 &str 或 8[T] 是 
完全 合理 的 。 由 于 str 实现 了 PartiatEq<str>， 因 此 下 列 断 言 都 是 相等 的 : 
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assert!("ungula" != "ungulate"); 
assert!("ungula".ne("ungulate")); 


在 这 里 ，Self 和 Rhs 可 能 是 非 固定 大 小 的 str， 从 而 让 ne 的 self 和 rhs 参数 都 是 &str 值 。 
关于 固定 大 小 的 类 型 、 非 固定 大 小 的 类 型 ， 以 及 Sized 特 型 ，13.2 节 会 详细 介绍 。 


为 什么 这 个 特 型 叫 PartialEq 呢 ? 传统 数学 对 相等 关系 (这 里 相等 是 一 种 情形 ) 的 定义 包 
含 3 方面 要 求 。 对 于 任意 值 x 和 y， 需 满足 以 下 条 件 。 


。 如 果 x == y 是 true， 那么 y == x 也 必须 是 true。 换 句 话 说 ， 交 换 比 较 相 等 操作 的 两 个 
操作 数 不 影 响 比 较 结果 。 

。 如 果 x == y 且 y == z， 那么 x == z 也 一 定 是 true。 对 于 任何 连续 相等 的 值 ， 其 中 任意 
一 个 值 都 与 其 他 值 直接 相等 。 相 等 具有 传递 性 。 


。 Xx == x 永远 是 true。 


第 三 个 要 求 似乎 很 明显 ， 都 不 用 说 出 来 了 ， 但 这 条 规则 正 是 很 多 问题 的 根源 。Rust 的 f32 
和 f64 是 IEEE 标准 浮 点 值 。 根 据 该 标准 ，6.6/6.9 或 其 他 没有 适当 值 的 表达 式 必 须 产 生 特 
殊 的 “Not a Number”( 非 数值 ) 值 ， 通 常 称 为 NaN 值 。 这 个 标准 进一步 要 求 NaN 值 必 须 不 
跟 其 他 任何 值 相等 ， 包 括 它 自己 。 比 如 ， 该 标准 要 求 所 有 下 列 断 言 为 true: 

assert!(f64: :is_nan(0.0/0.0)); 


assert eq!(0.0/0.0 == 0.0/0.0, false); 
assert_ eq!(0.0/0.0 != 0.0/0.0, true); 


不 仅 如 此 ， 任 何 与 NaN 的 顺序 比较 都 必须 返回 false: 


assert eq!(0.0/0.0 < 0.0/0.0, false); 
assert eq!(0.0/0.0 > 0.0/0.0, false); 
assert eq!(0.0/0.0 <= 0.0/0.0, false); 
assert eq!(0.0/0.0 >= 0.0/0.0, false); 


Rust 的 == 操作 符 符 合 IEEE 对 相等 关系 的 前 两 个 要 求 ， 而 在 涉及 IEEE 浮 点 值 时 明显 不 
符合 第 三 个 条 件 。 这 就 叫 作 部 分 相等 关系 (partial equivalence relation)， 所 以 Rust 使 用 
PartialEq 这 个 名 字 为 = 操作 符 定 义 了 内 置 的 特 型 。 如 果 你 知道 自己 写 的 泛 型 代码 中 的 类 
型 参数 只 能 是 PartialEq， 那 么 可 以 假定 前 两 个 要 求 有 效 ， 但 不 能 假定 一 个 值 始终 与 它 自 
身 相等 。 
这 多 少 有 点 违反 直觉 ， 一 不 小 心 还 可 能 导致 错误 。 如 果 你 的 泛 型 代码 需要 保证 完全 相等 的 
关系 ， 那 可 以 使 用 std: :cmp: :Eq 特 型 作为 绑 定 ， 它 表示 完全 相等 关系 。 换 名 话说， 如 果 一 
个 类 型 实现 了 Eq， 那 么 这 个 类 型 的 每 个 值 x>， 一 定 有 x == x 为 true。 在 实践 中 ， 几 乎 所 
有 实现 PartialEq 的 类 型 都 应 该 实现 Eq。f32 和 f64 是 标准 库 中 仅 有 的 两 个 为 PartialEq 而 
韭 Eq 的 类 型 。 
标准 库 将 Eq 定义 为 PartialEq 的 扩展 ， 而 且 没 有 定义 新 方法 : 

trait Eq: PartialEq<Self> { } 
如 果 你 的 类 型 是 PartiaLEq， 那 么 也 应 该 希望 它 是 Eq。 为 此 ， 必 须 再 明确 实现 Eq， 尽管 此 
实现 并 不 真 的 需要 定义 任何 新 函数 或 类 型 。 因 此 ， 为 Complex 实现 Eq 非常 简单 ; 





































































































impL<T: Eq> Eq for CompLex<T> { } 
甚至， 在 Complex 类 型 定义 的 derive 属性 中 包含 Eq 就 足以 实现 它 了 : 


#[derive(Clone, Copy, Debug, Eq, PartialEq)] 
struct Complex<T> { 





} 


对 泛 型 类 型 的 派生 实现 可 能 会 因 类 型 参数 不 同 而 不 同 。 有 了 derive 属性 ，Complex<i32> 会 
实现 Efq， 因 为 i32 可 以 完全 相等 ， 而 Complex<f32> 只 会 实现 PartialEq， 因 为 f32 无 法 实 
现 Eq。 

如 果 你 自己 实现 std: :cmp::PartiaLEq，Rust 则 无 法 检查 你 对 eq 和 ne 方法 的 定义 与 对 部 分 
或 全 部 相等 的 要 求 完 全 一 致 。 如 何 实现 它们 是 你 的 事 ，Rust 相信 你 会 以 符合 特 型 用 户 预 期 
的 方式 实现 相等 测试 。 

虽然 PartialEq 提供 了 ne 的 默认 定义 ， 但 如 果 愿 意 ， 你 也 可 以 自己 重新 实现 。 不 过 ， 重 新 
实现 必须 确保 eq 和 ne 互相 可 逆 。PartialEq 特 型 的 用 户 会 认为 这 是 自然 而 然 的 。 


12.3 顺序 比较 


Rust 通过 一 个 特 型 std: :cmp: :PartialOrd 规定 了 顺序 比较 操作 符 <、>、<= 和 >= 的 行为 : 


trait PartialOrd<Rhs = Self>: PartialEq<Rhs> where Rhs: ?Sized { 
fn partial_cmp(&self, other: &Rhs) -> Option<Ordering>; 

















fn lt(&self, other: &Rhs) -> booL { ... } 
fn le(&self, other: &Rhs) -> booL { ... } 
fn gt(&self, other: &Rhs) -> booL { ... } 
fn ge(&self, other: &Rhs) -> booL { ... } 


} 


没 错 ，Partialord<Rhs> 扩展 了 PartialEq<Rhs>。 这 意味 着 只 能 对 可 以 进行 相等 比较 的 类 型 
做 顺序 比较 。 


Partialord 特 型 唯一 需要 实现 的 方法 是 partial_cmp。 如 果 partial_cmp 返回 Some(o)， 则 
o 表示 self 与 other 的 关系 : 


enum Ordering { 
Less， // self < other 
Equal, // self == other 
Greater, // self > other 

















} 


但 如 果 partial_cmp 返回 None， 那 就 意味 着 self 和 other 相互 之 间 无 法 区 分 顺序 : 既 不 是 
谁 大 于 谁 ， 也 不 是 谁 等 于 谁 。 在 Rust 所 有 的 原始 类 型 中 ， 只 有 浮 点 值 之 间 的 比较 可 能 返回 
None。 特 别 地 ， 比 较 NaN ( 非 数 值 ) 与 任何 其 他 值 都 返回 None。12.2 节 对 NaN 值 进行 过 介绍 


与 其 他 二 元 操作 符 类 似 ， 要 比较 两 个 类 型 Left 和 Right 的 值 ，Left 必须 实现 Partialord 
<Right>。 如 表 12-5 所 示 ， 表 达 式 x < y 和 x >= y 都 是 对 Partialord 方法 调用 的 简写 。 
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表 12-5: 顺序 比较 操作 符 与 Partiatord 方 法 





表 达 式 等 价 方 法 调用 默认 定义 
X < y xsUt(Cy) x.partial_cmp(&y) == Some(Less) 
x>y x.gt(y) x.partial_cmp(&y) == Some(Greater) 
Xs y x.le(y) match x.partial_cmp(&y) { 
Some(Less) | Some(EquaL) => true， 
_ => false, 
} 
Xx SY X.ge(y) match x.partial_cmp(&y) { 
Some(Greater) | Some(Equal) => true, 
_ => false, 
} 





如 前 面 例 子 中 所 示 ， 这 里 在 调用 相等 方法 时 假设 std: :cmp: :PartialOrd 和 std: :cmp: :Ordering 
在 作用 域 中 。 
如 果 你 知道 两 个 类 型 的 值 之 间 总 能 分 出 个 先后 ， 就 可 以 实现 更 严格 的 std: :cmp::0rd 特 型 : 


trait Ord: Eq + PartialOrd<Self> { 
fn cmp(&self, other: &Self) -> Ordering; 














} 


这 里 的 cmp 方法 只 返回 0rdering 而 非 ( 像 partial_cmp 那样 返回 ) 0piton<0rdering>。 换 
句 话说 ，cmp 要 么 返回 相等 ， 要 么 返回 参数 之 间 的 相对 顺序 。 几 乎 所 有 实现 Partialord 的 
类 型 也 都 会 实现 0rd。 在 标准 库 中 ， f32 和 f64 是 此 规则 的 唯一 例外 。 


由 于 复数 没有 自然 顺序 ， 因 此 没 办 法 使 用 前 几 节 中 的 Complex 类 型 展示 对 Partiatord 的 示 
例 实 现 。 为 此 ， 假 设 有 以 下 类 型 ， 表 示 属 于 某 个 半 开 区 间 的 数值 集合 


#[derive(Debug, PartialEq)] 
struct Interval<T> { 


Lower: T，// 包含 
upper: T // 不 包含 






































} 
我 们 想 让 这 种 类 型 的 值 实现 部 分 排序 ， 即 如 果 一 个 区 间 完 全 落 在 另 一 个 区 间 之 前 且 没 有 重 
合 ， 则 该 区 间 小 于 另 一 个 区 间 。 如 有 果 两 个 不 相等 的 区 间 重 合 ， 即 革 一 侧 的 某 些 元 素 小 于 另 
一 侧 的 某 些 元 素 ， 则 无 法 区 分 它们 的 顺序 。 两 个 相等 的 区 间 就 是 相等 的 。 以 下 Partialord 
的 实现 满足 以 上 规则 : 


use std::cmp::{Ordering, PartialOrd}; 




















impl<T: PartialOrd> PartialOrd<Interval<T>> for Interval<T> { 
fn partial_cmp(&self, other: &Interval<T>) -> Option<Ordering> { 
if self == other { Some(Ordering::Equal) } 
else if seLf.Lower >= other.upper { Some(Ordering::Greater) } 
else if self.upper <= other.Lower { Some(Ordering::Less) } 
else { None } 





有 了 这 个 实现 ， 就 可 以 写 出 下 面 的 代码 进行 测试 了 : 


assert!(Interval { lower: 10, upper: 20 } < Interval { lower: 20, upper: 40 }); 
assert!(IntervaL { lower: 7, Upper: 8 } >= Interval { lower: 0, Upper: 1 }); 
assert!(Interval { lower: 7, upper: 8 } <= Interval { lower: 7, upper: 8 }); 


// 重合 的 区 间 相 互 之 间 无 法 确定 顺序 

let left = Interval { lower: 10, upper: 30 }; 
Let right = Interval { lower: 20, upper: 40 }; 
assert!(!(Left < right)); 

assert!(!(Left >= right)); 











12.4 Index 与 IndexMut 


通过 实现 std: :ops::Index 和 std::ops::IndexMut 特 型 ， 可 以 对 相应 类 型 使 用 类 似 a[i] 这 
样 的 索引 表达 式 。 数 组 直接 支持 [] 操作 符 ， 但 对 其 他 类 型 而 言 ， 表 达 式 a[i] 通常 都 是 对 
*a.index(i) 的 简写 ， 其 中 ，index 是 std: :ops::Index 特 型 的 方法 。 不 过 ， 如 果 这 个 表达 
式 被 赋值 或 被 可 修改 地 借用 ， 则 a[i] 就 是 对 调用 std: :ops::IndexMut 特 型 方法 *a.index_ 
mut(i) 的 简写 


以 下 是 上 述 特 型 的 定义 : 


trait Index<Idx> { 
type Output: ?Sized; 
fn index(&self, index: Idx) -> &Self::0utput; 























} 


trait IndexMut<Idx>: Index<Idx> { 
fn index_mut(&mut self, index: Idx) -> &mut Self::O0utput; 


} 


注意 ， 这 两 个 特 型 以 索引 表达 式 的 类 型 作为 参数 。 为 此 ， 可 以 使 用 usize 索引 切片 从 而 引 
用 一 个 元 素 ， 因 为 切片 实现 了 Index<usize>。 同样 ， 可 以 使 用 表达 式 a[i..j] 来 引用 子 切 
片 ， 因 为 切片 也 实现 了 Index<Range<usize>>。 这 个 表达 式 就 是 对 以 下 方法 调用 的 简写 


*a.index(std::ops::Range { start: i, end: j }) 


Rust 的 HashMap 和 BTreeMap 集合 支持 以 任意 可 散 列 或 可 排序 的 类 型 作为 索引 。 下 列 代码 之 
所 以 有 效 ， 是 因为 HashMap<&str，i32> 实现 了 Index<&str>: 


























use std::collections::HashMap; 
Let mut m = HashMap: :new(); 
m.insert(" 十 "，10); 

insert(" 百 "，100); 

insert(" 千 ", 1000); 
insert(" 万 ",1_0000); 
insert("{L", 1_0000_0000); 


ce | 





FF-"], 10); 
]， 1000); 


assert_eq!(m[" 
assert_eq!(m[" 千 ' 
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其 中 的 索引 表达 式 等 价 于 : 


use std::ops::Index; 
assert eq!(*m.index(" 十 "), 10); 
assert eq!(*m.index(" 千 "), 1000); 


Index 特 型 的 关联 类 型 0utput 限定 了 索引 表达 式 产 出 的 类 型 ， 对 HashMap 而 言 ，Index 实现 
的 output 类 型 就 是 132。 


IndexMut 特 型 扩展 了 Index， 增 加 了 一 个 接收 可 修改 的 self 引用 作为 参数 的 index_mut 方 
法 ， 该 方法 返回 对 一 个 0utput 值 的 可 修改 引用 。 当 索引 表达 式 出 现在 必要 的 上 下 文中 的 时 
修 ，Rust 会 自动 选择 index_mut。 比 如 ,假设 有 如 下 代码 : 
Let mut desserts = vec!["Howalon".to_string(), 
"Soan papdi" .to_string()]; 


desserts[0].push_str(" (fictional)"); 
desserts[1].push_str(" (real)'"); 


因为 push_str 方法 操作 的 是 &mut seLf， 所 以 上 面 最 后 两 行 代码 等 价 于 : 


use std::ops::IndexMut; 
(*desserts.index_mut(0)).push_str(" (fictional)"); 
(*desserts.index_ mut(1)).push_str(" (real)"); 


IndexMut 有 一 个 限制 ， 就 是 根据 设计 它 必 须 返 回 对 某 个 值 的 可 修改 引用 。 这 就 是 不 能 使 用 
类 似 m[" 十 "] = 349 这样 的 表达 式 给 HashMap m 插 入 值 的 原因 。 要 实现 这 个 插值 操作 ， 散 
列表 需要 先 为 " 十 " 创建 一 个 记录 ， 以 某 个 值 作为 其 默认 值 ， 然 后 再 返回 对 该 记录 的 可 修 
改 引 用 。 然 而 ， 并 非 所 有 类 型 都 能 以 很 小 的 代价 使 用 默认 值 ， 有 些 默认 值 删除 起 来 还 是 比 
较 费 事 的 。 仅 仅 为 了 赋值 就 创建 这 么 一 个 立即 要 删除 的 默认 值 是 一 种 浪费 。(Rust 后 续 版 
本 有 计划 对 此 做 出 改进 。) 


索引 最 频繁 的 使 用 场景 就 是 集合 。 比 如 ， 假 设 我 们 有 一 个 位 图 图 片 ， 类 似 于 第 2 章 曼 德 布 
洛 特集 绘制 程序 中 创建 的 那个 。 当 时 程序 中 包含 如 下 代码 

pixels[row * bounds.0 + column] = ...; 
假如 有 一 个 Image<u8> 类 型 的 二 维 数组 ， 那 就 可 以 不 必 像 这 样 写 出 数学 计算 表达 式 而 直接 
访问 像素 了 : 


image[row][coLumn] = ...; 


为 此 ， 需 要 先 声 明 一 个 结构 体 : 


struct Image<P> { 
width: usize, 
pixels: Vec<P> 


} 



































impl<P: Default + Copy> Image<P> { 
/// 创建 给 定 大 小 的 一 张 新 图 片 
fn new(width: usize, height: usize) -> Image<P> { 
Image { 
width, 





pixels: vec![P::default(); width * height] 
} 
} 
} 


而 以 下 就 是 满足 要 求 的 Index 和 IndexMut 的 实现 : 


impl<P> std::ops::Index<usize> for Image<P> { 
type Output = [P]; 
fn index(&self, row: usize) -> &[P] { 
Let start = row * self.width; 
&self.pixels[start .. start + self.width] 
} 
} 


impl<P> std::ops::IndexMut<usize> for Image<P> { 
fn index_mut(&mut self, row: usize) -> &mut [P] { 
let start = row * self.width; 
&mut self.pixels[start .. start + self.width] 
} 
} 


这 样 ， 对 Image 的 索引 会 返回 一 个 像素 切片 ， 而 对 这 个 切片 的 索引 会 返回 个 别 像素 。 
需要 注意 的 是 ， 在 使 用 image[row][coLumn] 索引 像素 时 ， 如 果 row 越界 ， 则 .index() 方法 


会 尝试 索引 超出 范围 的 seLf.pixeLs， 从 而 触发 证 异 。 这 也 是 Index 和 IndexMut 实现 应 有 
的 行为 : 越界 访问 会 被 发 现 并 导致 证 异 ， 就 跟 索 引 数 组 、 切 片 或 向 量 时 越界 一 样 。 


12.5 ”其 他 操作 符 


并 不 是 所 有 的 操作 符 都 可 以 在 Rust 中 重 载 。 截 止 到 Rust 1.17， 错 误 检查 操作 符 ? 只 能 用 于 
Result 值 。 类 似 地 ， 逻 辑 操作 符 && 和 || 也 仅 限于 布尔 值 。.. 操作 符 只 能 用 于 创建 Range 值 ， 
& 操作 符 只 能 借用 引用 ， 而 = 操作 符 只 能 转移 或 复制 值 。 上 述 这 些 操作 符 都 不 支持 重 载 。 

解 引 用 操作 符 *val 和 访问 字段 及 调用 方法 的 点 操作 符 (如 val.field 和 val.method()) 可 
以 使 用 Deref 和 DerefMut 特 型 来 重 载 ， 具 体 细节 下 一 章 会 介绍 。( 不 在 本 章 介绍 主要 是 因 
为 这 些 特 型 不 仅仅 是 重 载 几 个 操作 符 那 么 简单 。) 

Rust 不 支持 重 载 国 数 调用 操作 符 (f(x) )。 如 果 你 需要 一 个 可 调用 的 值 ， 通 常 写 一 个 闭 包 
就 可 以 了 。 第 14 章 在 介绍 Fn、FnMut 和 Fnonce 等 特殊 的 特 型 时 将 解释 其 中 的 工作 原理 。 
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第 13 章 





实用 特 型 


科学 无 非 就 是 在 自然 界 的 多 样 性 中 寻找 和 发 现 一 致 性 。 或 者 更 确切 地 讲 ， 从 我 们 
经 验 的 多 样 性 中 发 现 一 致 性 。 用 Coleridge 的 话说 ， 诗 、 画 、 艺 术 ， 同 样 是 从 多 
样 性 中 发 现 一 致 性 。 





Jacob Bronowski 


除了 操作 符 重 载 ， 也 就 是 前 一 章 介绍 的 内 容 ， 有 些 内 置 特 型 可 以 让 我 们 直接 修改 Rust 语言 


和 标准 库 的 一 部 分 。 


。 可 以 使 用 Drop 特 型 在 值 超出 作用 域 时 请 除 它 ， 类 似 C++ 中 的 解构 函数 。 
。 像 Box<T> 和 Rc<T> 这 样 的 智能 指针 类 型 可 以 实现 Deref 特 型 ， 从 而 让 指针 反映 封装 值 的 


方法 。 


。 通过 实现 From<T> 和 Into<T> 特 型 ， 可 以 告诉 Rust 怎么 将 值 从 一 种 类 型 转换 为 另 一 种 


类 型 。 


本 章 将 集中 介绍 Rust 标准 库 中 的 一 批 有 用 的 特 型 ， 有 具体 参见 表 13-1。 
表 13-1: 实用 特 型 概述 


特 ”型 
Drop 

Sized 

Clone 

Copy 

Deref 与 DerefMut 
Default 

AsRef 与 AsMut 





简 介 


解构 函数 。 清 除 值 时 Rust 自动 运行 的 清除 代码 





及 


针对 有 合理 “时 











A 认 值 ”的 类 型 














转换 特 型 ， 借 


] 某 种 类 型 的 引 月 


标记 特 型 ,针对 编译 时 可 以 知道 大 小 的 类 型 (而 不 是 像 切 片 那样 动态 大 小 的 类 型 ) 
针对 支持 克隆 值 的 类 型 
标记 特 型 ， 针 对 可 以 简单 地 对 内 存 中 包含 的 值 进行 逐 字 节 复 制 来 克隆 的 类 型 


智能 指针 类 型 的 特 型 





j 
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注 





特 型 痢 让 

Borrow 与 BorrowMut ”转换 特 型 ， 类 似 AsRef/AsMut， 但 额外 保证 一 致 的 散 列 、 顺 序 和 相等 
From 与 Into 转换 特 型 ， 将 某 种 类 型 的 值 转换 为 另 一 种 类 型 

ToOwned 转换 特 型 ， 将 引用 转换 为 所 有 值 


当然 ， 还 有 其 他 重要 的 标准 库 特 型 。 比 如 ， 第 15 章 将 介绍 的 Iterator 和 IntoIterator， 
第 16 章 将 介绍 的 Hash 特 型 (针对 计算 散 列 码 )， 还 有 第 19 章 将 介绍 的 用 于 标记 线程 安全 
类 型 的 send 和 Sync。 


13.1 Drop 


当 一 个 值 的 所 有 者 离开 时 ，Rust 会 清除 (drop) 这 个 值 。 清 除 值 涉及 释放 相关 的 值 、 堆 存 
储 空间 ， 以 及 该 值 拥有 的 系统 资源 。 清 除 会 在 各 种 条 件 下 发 生 ， 包 括 变 量 超 出 作用 域 、 表 
达 式 的 值 被 ; 操作 符 丢 弃 、 截 断 向 量 时 从 末尾 删除 其 元 素 ， 等 等 。 
很 大 程度 上 ，Rust 会 自动 处 理 清 除 值 。 比 如 ， 假 设 定 义 了 下 面 这 个 类 型 : 

struct Appellation { 


name: String, 
nicknames: Vec<String> 














} 


Appellation 拥有 字符 串 的 内 容 和 向 量 元 素 缓冲 区 对 应 的 堆 存 储 空间 。Rust 会 在 
Appellation 被 清除 时 自动 释放 这 些 存 储 空 间 ， 而 无 须 在 代码 中 额外 声明 。 然 而 ， 如 果 你 
愿意 ， 也 可 以 通过 实现 std: :ops::Drop 特 型 自 定义 Rust 清除 你 的 类 型 值 的 方式 : 


trait Drop { 
fn drop(&mut self); 


Drop 的 实现 类 似 于 C++ 中 的 解构 函数 或 其 他 语言 中 的 终结 器 (finalizer)。 在 清除 值 时 ， 如 
果 该 值 实现 了 std: :ops::Drop， 那 么 Rust 会 在 按 常 规 清除 其 字段 或 元 素 拥 有 的 值 之 前 先 调 
用 它 的 drop 方法 。 这 种 对 drop 方法 的 隐 式 调用 是 调用 该 方法 的 唯一 方式 。 如 果 你 显 式 地 
调用 该 方法 ，Rust 则 会 报错 。 


因为 Rust 在 清除 其 字段 或 元 素 之 前 调用 Drop: :drop， 所 以 该 方法 接收 到 的 值 始终 是 完全 初 
始 化 的 。 为 Appellation 类 型 实现 Drop 的 代码 可 以 任意 使 用 其 字段 : 


impl Drop for Appellation { 
fn drop(&mut self) { 
print!("Dropping {}", self.name); 
if !self.nicknames.is empty() { 
print!(" (AKA {})", self.nicknames.join(", ")); 























println!(""); 
} 
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基于 以 上 实现 ， 可 以 写 出 下 面 的 代码 : 











Let mut a = Appellation { name: "Zeus" .to_string()， 
nicknames: vec!["cloud coLLector" .to_string() ， 
"king of the gods" .to_string()] }; 


println!("before assignment"); 
a = Appellation { name: "Hera".to_string(), nicknames: vec![] }; 
println!("at end of block"); 

} 


在 把 第 二 个 Appellation 赋值 给 a 时， 第 一 个 会 被 清除 ， 而 当 离 开 a 的 作用 域 时 ， 
会 被 清除 。 因 此 ， 以 上 代码 会 打印 出 如 下 结果 ， 

before assignment 

Dropping Zeus (AKA cloud collector, king of the gods) 


at end of block 
Dropping Hera 


既然 为 Appellation 实现 的 std: :ops::Drop 除了 打印 消息 什么 也 没 做 ， 那 它 的 内 存 到 底 是 
怎么 释放 的 呢 ? Vec 类 型 实现 了 Drop， 可 以 清除 自己 的 每 个 元 素 ， 然 后 释放 它们 占用 的 堆 
内 存 空间 。String 内 部 使 用 Vec<u8> 保存 其 文本 ， 因 此 String 自身 不 需要 实现 Drop， 而 
是 由 vec 负责 释放 其 字符 。 同 样 的 原理 也 可 以 延伸 到 Appellation 值 : 在 一 个 值 被 清除 后 ， 
最 终 其 Vec 对 Drop 的 实现 会 负责 释放 每 个 字符 串 的 内 容 ， 直 到 释放 保存 向 量 元 素 的 缓存 
区 。 保 存 Appellation 值 自身 的 内 存 当 然 也 有 所 有 者 ， 可 能 是 一 个 局 部 变量 或 某 个 数据 结 
构 ， 它 们 会 负责 释放 对 应 的 内 存 。 


如 果 变 量 的 值 被 转移 到 了 其 他 地 方 ， 导 致 变量 在 超出 作用 域 时 处 于 未 初始 化 状态 ，Rust 则 
不 会 尝试 清除 该 变量 ， 因 为 这 个 变量 里 已 经 没有 值 需要 清除 了 。 


根据 控制 流 的 不 同 ， 无 论 变量 的 值 是 否 被 转移 ， 这 个 原理 都 是 适用 的 。 在 这 种 情况 下 ， 
Rust 会 用 一 个 不 可 见 的 标志 跟踪 变量 的 状态 ， 该 标志 表示 变量 的 值 是 否 需要 被 清除 : 


let p; 
{ 



























































let q = Appellation { name: "Cardamine hirsuta".to_string(), 
nicknames: vec!["shotweed".to_string(), 
"bittercress".to_string()] }; 
if complicated condition() { 
P = 9， 
} 


println!("Sproing! What was that?"); 


根据 complicated_condition 条 件 返 回 true 还 是 false，Appellation 的 值 可 能 由 p 或 q 所 
拥有 ， 而 另 一 个 会 变 成 未 初始 化 。 这 个 值 跑 到 哪里 去 ， 将 决定 它 会 在 println! 之 前 或 之 后 
被 清除 ， 因 为 q 的 作用 域 在 printtn! 之 前 结束 ， 而 p 的 作用 域 在 println! 之 后 结束 。 尽 
管 一 个 值 可 以 转移 多 次 ， 但 Rust 对 这 个 值 只 会 清除 一 次 。 


如 果 不 是 自 定义 类 型 拥有 Rust 不 知道 的 资源 ， 一 般 不 需要 实现 std: :ops::Drop。 比 如 ,在 






































Unix 系统 上 ，Rust 标准 库 在 内 部 使 用 以 下 类 型 表示 操作 系统 的 文件 描述 符 : 


struct FileDesc { 
fd: c_int, 


} 


这 个 FileDesc 的 fd 字段 只 是 文件 描述 符 的 编号 ， 应 该 在 程序 结束 时 关闭 。 而 c_int 是 132 
的 别名 。 标 准 库 为 FileDesc 实现 Drop 的 代码 如 下 : 
impl Drop for FileDesc { 
fn drop(&mut self) { 
Let _ = unsafe { libc::close(self.fd) }; 


} 
} 


这 里 的 Libc::ctose 是 C 库 的 close 函数 在 Rust 中 的 名 字 。Rust 的 代码 只 能 在 unsafe 块 
中 调用 C 函数 ， 因 此 标准 库 就 在 这 里 使 用 了 unsafe 块 。 


如 果 某 类 型 实现 了 Drop， 就 不 能 再 实现 Copy 特 型 。 如 果 一 个 类 型 是 Copy， 就 意味 着 简单 
的 字 节 对 字 节 的 复制 已 经 足以 产生 一 个 值 的 独立 副本 。 不 过 ， 在 同一 份 数 据 上 不 止 一 次 调 
用 同一 个 drop 方法 通常 是 错误 的 。 
标准 前 置 模块 中 包含 一 个 清除 值 的 函数 drop， 但 是 其 定义 一 点 也 不 新 奇 : 

fn drop<T>(_x: T) { } 


换 名 话说 ， 它 接收 一 个 参数 的 值 ， 从 调用 者 那里 取得 所 有 权 ， 然 后 什么 也 不 做 。Rust 会 在 
超出 作用 域 时 清除 _x 的 值 ， 跟 清除 其 他 变量 的 值 一 样 。 


13.2 Sized 


所 谓 固定 大 小 的 类 型 (sized type)， 指 的 是 其 值 在 内 存 中 都 具有 相同 大 小 。Rust 中 几乎 
所 有 类 型 都 是 有 大 小 的 ， 比 如 每 个 u64 占 8 字 节 ， 每 个 (f32，f32，f32) 元 组 占 12 个 字 
节 。 项 至 枚 举 类 型 都 是 有 大 小 的 ， 无 论 最 终 表 示 哪 种 变 体 ， 一 个 枚 举 类 型 的 值 始终 占 能 
保存 其 最 大 变 体 的 空间 。 虽 然 Vec<T> 拥有 分 配 在 堆 上 的 大 小 可 变 的 缓冲 区 ， 但 vec 值 本 
身 只 包含 一 个 指向 该 缓冲 区 的 指针 、 缓 冲 区 的 容量 及 其 长 度 。 因 此 Vec<T> 也 是 固定 大 小 
的 类 型 。 


不 过 ，Rust 也 有 一 些 非 固定 大 小 的 类 型 (unsized type)， 即 其 值 的 大 小 并 不 固定 。 比 如 ， 
字符 串 切片 类 型 str (注意 没有 8) 是 非 国定 大 小 的 。 字 符 串 字面 量 "diminutive" 和 "big" 
是 对 占用 10 和 3 字 节 str 切片 的 引用 ， 如 图 13-1 所 示 。 像 [T] (同样 没有 &) 这 样 的 数组 
切片 类 型 也 是 非 固定 大 小 的 ， 即 共享 引用 &[u8] 可 以 指向 任意 大 小 的 [u8] 切片 。 因 为 str 
和 [T] 类 型 表示 大 小 不 确定 的 值 的 集合 ， 所 以 它们 是 非 固定 大 小 的 类 型 。 


Rust 中 男 一 个 常见 的 非 固 定 大 小 类 型 是 对 特 型 目标 的 引用 。 正 如 11.1.1 市 所 解释 的 ， 特 
型 目标 是 一 个 指向 实现 了 给 定 特 型 的 某 个 值 的 指针 。 比 如 ， 类 型 &std::io::Write 和 
Box<std: :io: :Write> 都 是 指向 实现 了 Write 特 型 的 某 个 值 的 指针 。 引 用 目标 可 能 是 一 个 文 
件 、 一 个 网 络 套 接 口 ， 或 者 实现 了 Write 的 自 定义 类 型 。 因 为 实现 Write 的 类 型 是 可 以 扩 
充 的 ， 所 以 Write 作为 类 型 被 认为 是 非 固定 大 小 的 ， 即 其 值 的 大 小 可 变 。 
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13-1; 对 非 固定 大 小 值 的 引用 


Rust 不 能 在 变量 中 存储 非 固定 大 小 的 值 ， 也 不 能 将 它们 作为 参数 传递 。 只 能 通过 &str 或 
Box<Write> 这 样本 身 是 固定 大 小 的 指针 来 使 用 它们 。 如 图 13-1 所 示 ， 指 向 非 固定 大 小 值 的 
旧 针 始终 是 胖 指 针 ， 占 两 个 字 宽 。 胖 指针 既 包 含 指向 切片 的 指针 ， 也 包含 切片 的 长 度 。 而 
特 型 目标 也 包含 一 个 指向 方法 实现 的 虚拟 表 的 指针 。 


特 型 目标 和 切片 的 指针 恰好 具有 对 称 性 。 对 这 两 者 而 言 ， 类 型 都 缺少 使 用 它们 的 必要 信 
息 。 不 知道 长 度 ， 就 不 能 使 用 索引 访问 [u8] 值 ， 而 不 知道 对 Write 的 特定 实现 ， 就 不 能 调 
用 Box<Write> 上 的 方法 。 同 样 对 这 两 者 而 言 ， 胖 指针 补充 了 类 型 缺少 的 信息 ， 给 出 了 长 度 
和 虚拟 表 的 指针 。 遗 漏 的 静态 信息 被 动态 信息 所 取代 。 


所 有 固定 大 小 的 类 型 都 实现 了 std::marker::Sized 特 型 ， 这 个 特 型 没有 方法 或 关联 类 
型 。Rust 为 其 适用 的 所 有 类 型 自动 实现 了 这 个 特 型 ， 开 发 者 不 能 自己 实现 。 唯 一 需要 使 用 
Sized 的 场景 ， 就 是 绑 定 类 型 变量 。 比 如 ，T: Sized 绑 定 要 求 T 必须 是 一 个 编译 时 大 小 已 
知 的 类 型 。 这 种 特 型 称 为 标记 特 型 (marker trait) ， 因 为 Rust 语言 自身 使 用 它们 将 某 些 类 
型 标记 为 具有 关注 的 特征 。 

由 于 非 国定 大 小 的 类 型 具有 很 大 局 限 性 ， 因 此 大 多 数 泛 型 变量 应 该 被 限制 为 使 用 sized 类 
型 。 事 实 上 ， 正 是 因为 太 常 见 了 ， 所 以 Rust 隐 式 地 将 其 作为 了 默认 值 。 换 名 话说 ， 如 果 
你 写 struct S<T> { ... }， 那么 Rust 会 将 其 理解 为 struct S<T: Sized> { ... }。 假 如 
不 想 这 样 限制 T， 就 必须 明确 地 写 出 来 ， 比 如 写成 struct S<T: ?Sized> { ... }。 这 里 的 
语法 ?Sized 只 能 在 这 种 情况 下 使 用 ， 其 含义 是 “不 一 定 是 Sized”。 比 如 ， 如 果 你 写 的 是 
struct S<T: ?Sized> { b: Box<T> }， 那 么 Rust 会 允许 使 用 S<str> 和 5S<Write> (此 时 箱 
子 变 成 了 一 个 胖 指针 ) ， 除 此 之 外 ， 还 允许 使 用 5<i32> 和 S<String> (此 时 箱子 是 一 个 普 
通 指针 )。 

虽然 有 局 限 性 ， 但 非 固定 大 小 的 类 型 让 Rust 的 类 型 系统 运行 得 更 顺畅 。 阅 读 标准 库 文档 的 
时 候 ， 你 偶尔 会 发 现 类 型 变量 上 的 ?Sized 绑 定 。 此 时 通常 都 意味 着 给 定 类 型 只 是 指向 ， 并 
且 允 许 相 关 代 码 操作 切片 和 特 型 目标 以 及 普通 的 值 。 如 果 类 型 变量 具有 ?Sized 绑 定 ， 人 们 
通常 称 其 为 不 知 是 否 固定 大 小 (questionably sized) ， 即 可 能 是 Stzed， 也 可 能 不 是 。 


除了 切片 和 特 型 目标 ， 还 有 一 种 非 固定 大 小 类 型 。 结 构 体 类 型 的 最 后 一 个 字段 〈 仅 最 后 一 
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个 字段 ) 可 能 是 非 固定 大 小 的 ， 而 此 时 的 结构 体 本 身 也 是 非 固定 大 小 的 。 比 如 ，Rc<T> 引 
用 计数 指针 在 内 部 被 实现 为 一 个 指向 私有 类 型 RcBox<T> 的 指针 ， 该 类 型 用 于 保存 类 型 T 及 
其 引用 计数 。 下 面 是 RcBox 的 简化 定义 : 

struct RcBox<T: ?Sized> { 


ref_count: usize, 
value: T， 


























} 


这 里 value 字段 的 值 是 T， 也 就 是 要 对 它 保存 Rc<T> 的 引用 计数 。Rc<T> 解 引用 为 一 个 对 这 
个 字段 的 指针 。ref_count 字段 保存 引用 计数 。 


可 以 在 RcBox 中 使 用 固定 大 小 的 类 型 ， 如 RcBox<String>， 结 果 就 是 一 个 国定 大 小 的 结 
构 体 类 型 。 也 可 以 在 RcBox 中 使 用 非 国定 大 小 的 类 型 ， 如 RcBox<std: :fmt::DispLay> 
(其 中 Display 是 可 以 使 用 println! 及 类 似 的 宏 格 式 化 的 类 型 需要 实现 的 特 型 )， 结 果 
RcBox<Display> 就 是 一 个 非 固定 大 小 的 结构 体 类 型 。 


不 能 直接 构建 RcBox<Display> 值 。 相 反 ， 必 须 首 先 创建 一 个 普通 的 固定 大 小 的 RcBox， 并 
i 上 其 value 类 型 实现 Display， 类 似 于 RcBox<String>。 然 后 ，Rust 允许 你 将 引用 &RcBox<String> 
转换 为 胖 引 用 &RcBox<Display>: 

Let boxed_Lunch: RcBox<String> = RcBox { 


ref_count: 1， 
value: "lunch".to_string() 


















































二 


use std::fmt::Display; 
let boxed_ displayable: &RcBox<DispLay> = &boxed_lunch; 


在 给 函数 传 值 的 时 候 会 隐 式 地 发 生 这 种 转换 。 因 此 ， 可 以 给 接收 &8RcBox<Display> 的 函数 


传 一 个 &RcBox<String>: 





fn display(boxed: &RcBox<Display>) { 
println!("For your enjoyment: {}", &boxed.value); 


} 
dispLay(&boxed_Lunch ) ; 
这 会 产生 以 下 输出 : 


For your enjoyment: lunch 


13.3 Clone 
std: :clone: :Clone 特 型 适用 于 可 以 复制 自身 的 类 型 。Clone 的 定义 如 下 : 


trait Clone: Sized { 
fn clone(&self) -> Self; 
fn clone_from(&mut self, source: &Self) { 
*self = source.clone() 





} 























clone 方法 应 该 构建 self 的 一 个 独立 副本 并 返回 它 。 因 为 这 个 方法 的 返回 类 型 是 Self， 而 
且 函 数 不 可 能 返回 非 固定 大 小 的 值 ， 所 以 Clone 特 型 本 身 扩展 了 Sized 特 型 。 这 样 就 具有 
了 将 实现 的 Self 类 型 绑 定 为 Sized 的 效果 。 


克隆 一 个 值 通常 涉及 创建 该 值 所 拥有 一 切 内 容 的 副本 及 分 配 内 存 ， 因 此 clone 无 论 在 时 间 
消耗 还 是 内 存 占用 方面 都 可 能 比较 昂贵 。 例 如 ， 克 隆 Vec<String> 不 仅仅 要 复制 向 量 ， 还 
要 复制 其 包含 的 所 有 String 元 素 。 这 就 是 Rust 不 自动 克隆 值 ， 而 是 要 求 你 明确 地 调用 一 
个 方法 的 原因 。Rc<T> 和 Arc<T> 这 样 的 引用 计数 指针 属于 例外 ， 克 隆 它们 只 会 简单 地 递增 
相应 的 引用 计数 ， 然 后 返回 新 指针 。 


clone_fron 方法 将 self 修改 为 source 的 一 个 副本 。 这 个 方法 的 默认 定义 只 是 简单 地 克隆 
了 source， 然 后 将 副本 转移 到 *self 中 。 这 样 是 没有 问题 的 ， 但 对 于 某 些 类 型 而 言 ， 还 有 
实现 同样 效果 的 更 快 方式 。 比 如 ， 假 设 s 和 tt 都 是 String， 则 语句 s = t.clone(); 必须 先 
克隆 t， 清 除 s 原来 的 值 ， 然 后 再 将 克隆 的 值 转移 到 s 中 。 这 涉及 一 次 堆 分 配 和 一 次 堆 释 
放 。 如 果 原 始 s 值 所 有 的 堆 缓 冲 区 有 足够 的 容量 可 以 装 下 tt 的 内 容 ， 就 无 须 分 配 或 者 释放 
了 : 只 要 将 t 的 文本 复制 到 s 的 缓冲 区 ， 再 调整 一 下 长 度 即 可 。 在 泛 型 代码 中 ， 应 该 尽 可 
能 使 用 clone_from， 从 而 在 可 能 的 情况 下 应 用 这 种 优化 。 

如 果 你 对 Clone 的 实现 只 是 简单 地 对 自 有 类 型 的 每 个 字段 或 元 素 应 用 clone， 然 后 再 基于 
克隆 的 副本 构建 一 个 新 值 ， 那 么 clone_fron 的 默认 定义 就 足够 用 了 。 这 种 情况 下 ， 只 要 在 
类 型 定义 上 面 加 上 #[derive(Clone)]，Rust 就 会 为 你 实现 它 。 

标准 库 中 很 多 执行 复制 操作 有 意义 的 类 型 实现 了 Clone。 原 始 类 型 bool 和 i32 实现 了 
Clone， 容 器 类 型 String、Vec<T> 和 HashMap 也 实现 了 Clone。 有 些 类 型 实现 复制 操作 没有 
意义 ， 比 如 std::sync: :Mutex 就 没有 实现 CLone。 有 些 类 型 可 以 复制 ， 比 如 std::fs::File, 
但 在 操作 系统 没有 必要 资源 时 复制 会 失败 。 这 些 类 型 也 没有 实现 Clone， 因 为 clone 必须 万 
无 一 失 。 相 反 ，std::fs::File 提供 了 一 个 try_clone 方法 ， 这 个 方法 返回 可 以 报告 错误 的 


std: :io::ResuLt<FiLLe>。 


13.4 Copy 
第 4 章 曾 解释 过 ， 对 于 大 多 数 类 型 而 言 ， 赋 值 会 转移 值 ， 而 不 是 复制 值 。 转 移 值 更 有 利于 
跟踪 变量 所 拥有 的 资源 。 但 4.3 节 中 也 指出 了 例外 ， 即 不 拥有 任何 资源 的 简单 类型 可 以 是 
Copy 类 型 ， 这 种 类 型 的 赋值 会 生成 值 的 副本 ， 而 不 是 转移 值 并 让 原始 变量 变 成 未 初始 化 。 
当时 ， 我 们 并 没有 详细 说 明 什 么 是 Copy， 现 在 可 以 说 了 : 如 果 类 型 实现 了 std::marker::Copy 
标记 特 型 ， 那 么 它 就 是 Copy 类 型 。std: :marker: :Copy 标记 特 型 的 定义 如 下 ; 

trait Copy: Clone { } 
自 定义 类 型 实现 它 也 很 简单 : 

impl Copy for MyType { } 


但 由 于 Copy 是 一 个 标记 特 型 ， 对 语言 有 着 特殊 的 意义 ， 因 此 Rust 只 允许 类 型 在 字 市 对 字 
节 的 深度 复制 能 请 足 要 求 的 情况 下 实现 Copy。 那 些 可 能 拥有 任意 资源 ， 比 如 堆 缓冲 区 或 操 




































































































































































作 系 统 勾 柄 的 类 型 ， 不 能 实现 Copy。 

任何 实现 Drop 特 型 的 类 型 不 能 是 Copy。Rust 认为 如 果 一 个 类 型 需要 特殊 的 清理 代码 ， 那 
就 一 定 需 要 特殊 的 复制 代码 ， 因 此 不 能 是 Copy。 
与 Clone 一 样 ， 可 以 使 用 #[derive(Copy)] 让 Rust 为 你 派生 Copy。 事 实 上 ， 通 过 #[derive 
(Copy，Clone)] 同时 派生 这 两 者 的 情况 是 很 常见 的 。 

让 类 型 实现 Copy 之 前 要 想 清楚 。 虽 然 实现 Copy 可 以 让 类 型 更 容易 使 用 ,但 这 样 也 给 其 实 
现 带 来 了 严重 的 限制 。 隐 式 复制 的 代价 也 可 能 是 很 大 的 。4.3 市 曾 详细 解释 过 其 中 的 利害 。 












































13.5 Deref 与 DerefMut 


通过 实现 std: :ops::Deref 和 std: :ops::DerefMut 特 型 ， 可 以 修改 解 引 用 操作 符 * 和 .在 
自 定义 类 型 上 的 行为 。Box<T> 和 Rc<T> 这 样 的 指针 类 型 实现 了 这 两 个 特 型 ， 从 而 可 以 像 
Rust 内 置 的 指针 类 型 一 样 行事 。 比 如 ， 如 果 你 有 一 个 Box<Complex> 类 型 的 值 b， 那 么 *b 
引用 的 就 是 b 指向 的 ComptLex 值 ， 而 b.re 引用 其 实数 部 分 。 如 果 是 上 下 文 赋值 或 从 引用 目 
标 借用 可 修改 的 引用 ， 那 么 Rust 会 使 用 DerefMut (可 变 解 引 用 ) 特 型 。 否 则 ， 使 用 Deref 
取得 只 读 的 权限 足 矣 。 


这 两 个 特 型 的 定义 如 下 : 


trait Deref { 

type Target: ?Sized; 

fn deref(&self) -> &Self::Target; 
} 


























trait DerefMut: Deref { 
fn deref_ mut(&mut self) -> &mut Self::Target; 
} 


deref 和 deref_mut 方法 接收 &Self 引用 并 返回 &Self::Target 引用 。Target 应 该 是 Self 包 
含 、 拥 有 或 引用 的 资源 。 比 如 ， 对 于 Box<Complex> 来 说 ，Target 的 类 型 就 是 Complex。 要 
注意 ，DerefMut 扩展 了 Deref: 如 果 可 以 解 引 用 并 修改 资源 ， 那 么 就 应 该 可 以 借用 一 个 对 
它 的 共享 引用 。 因 为 这 两 个 方法 返回 的 引用 具有 与 &self 一 样 长 的 生命 期 ， 所 以 self 会 在 
返回 引用 的 生命 期 内 始终 保持 被 借用 。 


Deref 和 DerefMut 特 型 也 扮演 了 另 一 个 角色 。 由 于 deref 接收 &self 引用 并 返回 
&Self::Target 引用 ， 因 此 Rust 会 利用 这 一 点 自动 将 前 一 种 类 型 的 引用 转换 为 后 一 种 类 型 
的 引用 。 换 句 话 说， 如果 揪 入 一 次 deref 调用 可 以 防止 类 型 错 配 ， 那 Rust 会 为 你 插入 一 
次 。 实 现 DerefMut 可 以 实现 对 可 修改 引用 的 类 型 转换 。 这 种 类 型 转换 称 为 解 引 用 强制 转型 
(deref coercion) ， 即 一 种 类 型 被 “强制 ”表现 出 另 一 种 类 型 的 行为 。 


虽然 解 引 用 强制 类 型 转型 并 非 不 能 明确 写 出 来 ， 但 它们 很 方便 。 


如 果 有 一 个 Rc<String> 值 r, 你 想 对 它 调 用 String: :find, 那 么 可 以 简单 地 写作 .find('?')， 
而 不 需要 写成 (*r).find('?')。 这 里 的 方法 调用 隐 式 借用 了 r， 而 &Rc<String> 被 强制 转换 
为 &sString， 因 为 Rc<T> 实现 了 Deref<Target=T>。 
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。 可 以 在 String 值 上 使 用 spLit_at 等 方法 ， 即 使 split_at 是 str 切片 类 型 的 方法 ， 因 为 
String 实现 了 Deref<Target=str>。 这 样 ，String 就 不 需要 再 实现 str 的 所 有 方法 了 ， 

因为 可 以 将 &String 强制 转型 为 &str。 

。 如 果 有 一 个 字 节 癌 量 v， 你 想 将 它 传 给 一 个 期 待 字 节 切 片 &[u8] 的 国 数 ， 那 么 可 以 将 &v 
作为 参数 ， 因 为 Vec<T> 实现 了 Deref<Target=[T]>。 

必要 情况 下 ，Rust 会 连续 多 次 应 用 解 引用 强制 转型 。 比 如 ， 使 用 前 面 提 到 的 强制 转换 ， 可 

以 直接 在 Rc<String> 上 调用 spLit_at， 因 为 &Rc<String> 解 引 用 为 &String，&Sstring 又 解 

引用 为 &str， 而 &str 有 split_at 方法 。 

比如 ， 假 设 有 以 下 类 型 ; 


struct SeLector<T> { 


/// 此 Selector 中 可 用 的 元 素 


elements: Vec<T>, 








/// elements 中 “当前 ”元 素 的 索引 。Selector 类 似 于 当前 元 素 的 指针 


current: usize 








} 
为 了 让 Selector 能 够 像 文 档 注释 中 所 说 的 那样 ， 必 须 为 这 个 类 型 实现 Deref 和 DerefMut: 
use std::ops::{Deref, DerefMut}; 


impl<T> Deref for Selector<T> { 
type Target = T; 
fn deref(&self) -> &T { 
&self.elements[self.current] 
} 
} 


impl<T> DerefMut for Selector<T> { 
fn deref_mut(&mut self) -> &mut T { 
&mut self.elements[self.current] 
} 
} 


基于 以 上 实现 ， 就 可 以 像 下 面 这 样 使 用 Selector 了 : 

















Let mut s = Selector { elements: vec!['x', 
current: 2 }; 


Vo 'z"], 


// 因为 Selector 实 现 了 Deref， 所 以 可 以 使 用 * 操 作 符 引 用 它 的 当前 元 素 


assert eq!(*s, 'z'); 








// 通过 解 引用 强制 转型 直接 在 Selector 上 使 用 char 的 方法 断言 'z "是 一 个 字母 


assert!(s.is alphabetic()); 





// 通过 给 SeLector 的 引用 赋值 ， 将 'z ' 修 改 为 'w' 
ws = ww; 
assert eq!(s.elements, ['x', 'y 


', "Ww']); 
Deref 和 DerefMut 特 型 的 设计 初衷 是 为 了 实现 智能 指针 类 型 (如 Box、Rc 和 Arc)， 以 及 某 
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些 会 频繁 通过 引用 来 使 用 的 类 型 的 所 有 者 版 本 (如 Vec<T> 和 String 就 是 [T] 和 str 的 所 
有 者 版 本 )。 如 果 目 的 仅仅 是 让 Target 类 型 的 方法 自动 在 类 型 上 可 见 (就 像 C++ 中 让 基 类 
的 方法 在 子 类 上 可 见 那样 )， 则 不 应 该 实现 Deref 和 DerefMut。 这 样 并 不 能 保证 始终 有 效 ， 
一 旦 出 问题 则 很 难 发 现 。 

解 引 用 强制 转型 有 一 个 问题 可 能 导致 困惑 ， 即 Rust 通过 应 用 这 种 机 制 来 解决 类 型 冲突 ， 但 
不 会 应 用 它 来 满足 类 型 变量 的 绑 定 。 比 如 ， 下 面 的 代码 可 以 正常 运行 : 


Let s = Selector { elements: vec!["good" ，"bad" ，"ugtLy"] ， 
current: 2 }; 








fn show_it(thing: &str) { println!("{}", thing); } 

show_it(&s); 
在 调用 show_it(&s) 时 ，Rust 看 到 了 一 个 类 型 为 &Selector<&str> 的 实 参 和 一 个 类 型 为 
&str 的 形 参 ， 并 发 现 了 Deref<Target=str> 实现 。 于 是 ， 就 把 调用 重 写 为 了 show_it(s. 
deref())， 而 这 正 是 我 们 想 要 的 。 


然而 ， 如 果 把 show_it 改 为 泛 型 国 数 ，Rust 转眼 就 变 得 不 再 合作 了 : 


use std::fmt::Display; 
fn show_it generic<T: Display>(thing: T) { println!("{}", thing); } 
show_it generic(&s); 

















Rust 抱怨 道 : 


error[E0277]: the trait bound ‘Selector<&str>: Display ”is not satisfied 


| 
542 | show_it generic(&s); 
| ^^A^^A^AAAAA^^A^A^^^ trait “SeLector<&str>: Display. not satisfied 


| 
这 可 能 令 人 不 解 : 为 什么 把 函数 改写 成 泛 型 函数 就 会 报错 呢 ? 没 错 ，Selector<&str> 并 未 
实现 Display， 但 它 解 引用 为 &str， 后 者 则 实现 了 Display。 
由 于 我 们 传递 的 实 参 类 型 是 &seLector<&str>， 而 国 数 的 形 参 类 型 是 &8T， 因 此 类 型 变量 T 
必须 是 Selector<&str>。 然 后 ，Rust 检查 绑 定 T: Display 是 否 满 足 。 因 为 它 不 会 在 满足 类 
型 变量 的 绑 定 时 应 用 解 引用 强制 转型 ， 所 以 检查 失败 。 
要 解决 这 个 问题 ， 可 以 使 用 as 操作 符 显 式 进行 强制 转换 : 


show_it generic(&s as &str); 





13.6 Default 


某 些 类 型 拥有 明显 合理 的 默认 值 ， 比 如 上 默认 向 量 或 字符 串 是 空 的 、 默 认 数 值 是 0、 上 默认 
Option 是 None， 等 等 。 这 些 有 默认 值 的 类 型 都 实现 了 std::default::Default 特 型 
trait Default { 


fn default() -> Self; 
} 




















default 方法 简单 地 返回 类 型 self 的 一 个 新 值 。String 对 Default 的 实现 很 直观 : 


impl Default for String { 
fn default() -> String { 
String: :new() 





} 
} 


Rust 的 所 有 和 集合 类 型 ， 比 如 Vec、HashMap、BinaryHeap 等 ， 都 实现 了 Default， 而 且 
default 方法 都 返回 空 :集合 。 这 在 你 想 构建 某 个 值 的 集合 ， 但 希望 让 调用 者 决定 到 底 构建 
什么 集合 时 非常 有 用 。 例 如 ，Iterator 特 型 的 partition 方法 会 将 迭代 器 产生 的 值 分 成 两 
个 集合 ， 而 哪个 值 分 到 哪个 集合 由 一 个 闭 包 来 决定 : 

use std::collections::HashSet; 

Let squares = [4, 9, 16, 25, 36, 49, 64]; 


Let (powers_of_two, impure): (HashSet<i32>, HashSet<i32>) 
= squares.iter().partition(|&n| n & (n-1) == 0); 

















assert_eq!(powers_of_two.len(), 3); 
assert_ eq!(impure.len(), 4); 


闭 包 |&n| n * (n-1) == 0 利用 某 些 位 操作 来 识别 2 的 备 次 方 的 数值 ， 而 partition 利用 它 生 
成 了 两 个 Hashset。 当 然 ，partition 并 非 只 能 生成 Hashset， 可 以 让 它 生 成 你 想 要 的 任意 集 
合 类 型 。 只 要 该 集 合 类 型 实现 了 Default， 默 认 生 成 一 个 空 集合 ， 以 及 Extend<T>， 能 够 向 集 
合 中 添加 T 即 可 。String 实现 了 Default 和 Extend<char>， 因 此 你 的 代码 可 以 这 样 写 : 
Let (upper, lower): (String, String) 
= "Great Teacher Onizuka".chars().partition(|&c| c.is_uppercase()); 


assert_eq!(uyupper, "GT0"); 
assert eq!(lower, "reat eacher nizuka"); 


Default 的 另 一 个 常见 用 途 是 为 表示 大 量 参数 集合 (大 部 分 参数 通常 不 需要 改变 ) 的 
结构 体 生成 默认 值 。 例 如 ，glium 包 为 强大 而 复杂 的 OpenGL 图 形 库 提供 Rust 绑 定 。 
glium: :DrawParameters 结构 体 包含 22 个 字段 ， 每 个 字段 都 用 于 控制 OpenGL 应 该 如 何 泻 
染 某 些 图 形 的 位 等 细节 。gliunm 的 draw 函数 期 待 一 个 DrawParameters 结构 体 作 为 参数 。 由 
于 DrawParameters 实现 了 了 Default， 因此 可 以 创建 一 个 传 给 draw， 只 要 明确 给 出 想 要 改变 
的 字段 即 可 : 
Let params = gLium::DrawParameters { 
line_width: Some(0.02), 


point_size: Some(0.02), 
. Default: :default() 


























}; 
target.draw(..., &params).unwrap(); 


这 里 调用 Default::default() 是 为 了 创建 以 所 有 字段 的 默认 值 初始 化 的 DrawParameters 结 
构 体 ， 然 后 使 用 结构 体 的 .. 语法 为 需要 修改 的 Line_width 和 point_size 字段 创建 新 的 
值 ， 从 而 为 传 给 target.draw 做 好 准备 。 


如 果 类 型 T 实 现 了 pefauLt， 那 么 标准 库 会 自动 为 Rc<T>、Arc<T>、Box<T>、CeLL<T>、 














RefCell<T>、Cow<T>、Mutex<T> 和 RwLock<T> 实现 DefauLt。 说 到 默认 值 ， 以 Rc<T> 为 例 ， 
其 表示 一 个 指向 类 型 T 默 认 值 的 Rc。 


如 果 元 组 类 型 的 所 有 元 素 类 型 都 实现 了 Default， 且 该 元 组 类 型 也 实现 了 Default， 那 么 这 
个 元 组 默认 会 持 有 每 个 元 素 的 默认 值 。 


Rust 没有 为 结构 体 类 型 隐 式 实现 DefauLtt， 但 是 如 果 结 构 体 的 所 有 字段 都 实现 了 Default， 
则 可 以 使 用 #[derive(Default)] 自动 为 结构 体 实现 Default。 


任何 0ption<T> 的 默认 值 都 是 None。 


























13.7 AsRef 与 AsMut 
一 个 类 型 如 果实 现 了 AsRef<T>， 就 意味 着 可 以 有 效 地 向 它 借用 一 个 8T。 顾 名 思 义 ，Ashut 
就 是 可 修改 引用 。 这 两 个 特 型 的 定义 如 下 ， 


trait AsRef<T: ?Sized> { 
fn as_ref(&self) -> &T; 





} 


trait AsMut<T: ?Sized> { 
fn as_mut(&mut self) -> &mut T; 


} 
比如 说 ，Vec<T> 实现 了 AsRef<[T]>，String 实现 了 AsRef<str>。 之 所 以 可 以 将 String 的 
内 容 借用 为 字 节 数组 ， 就 是 因为 String 也 实现 了 AsRef<[u8]>。 
AsRef 通常 用 于 使 函数 在 接收 参数 的 类 型 中 更 加 灵活 。 例 如 ，std: :fs::File::open 函数 的 
声明 是 这 样 的 : 

fn open<P: AsRef<Path>>(path: P) -> Result<File> 


open 真正 想 要 的 是 &Path， 即 表示 文件 系统 路 径 的 类 型 。 但 从 这 个 签名 来 看 ，open 接收 任 

何 可 以 从 中 借用 &Path 的 类 型 ， 也 就 是 任何 实现 了 AsRef<Path> 的 类 型 。 符 合 这 个 要 求 的 

类 型 包括 String 和 str、 操 作 系 统 接口 字符 串 类 型 0sSstring 和 0sStr， 当 然 还 有 PathBuf 

和 Path。 完 整 的 列表 可 以 参考 标准 库 文 档 。 因 此 ， 可 以 给 open 传人 一 个 字符 串 字 面 量 ， 
let dot emacs = std::fs::File::open("/home/jimb/.emacs")?; 

标准 库 中 所 有 的 文件 系统 访问 函数 都 可 以 像 这 样 接收 路 径 参数 。 对 调用 者 而 言 ， 效 果 类 似 

于 C++ 中 重 载 的 函数 ， 只 不 过 Rust 采用 的 是 另 一 种 不 同 的 手段 ， 即 规定 函数 可 以 接收 哪 

些 类 型 的 参数 。 

当然 ， 还 需要 进一步 解释 。 字 符 串 字面 量 是 &str， 但 实现 AsRef<Path> 的 是 str， 没 有 &。 

正如 13.5 节 所 解释 的 ，Rust 不 会 尝试 解 引 用 强制 转型 去 满足 类 型 变量 绑 定 ， 因 此 这 里 不 会 

发 生 强 制 转型 。 

所 幸 的 是 ， 标 准 库 包 含 了 一 个 非 限制 性 (blanket) 的 实现 : 


impl<'a, T, U> AsRef<U> for &'a T 
where T: AsRef<U>， 










































































T: ?Sized, U: ?Sized 
{ 
fn as_ref(&self) -> &U { 
(*self).as_ref() 
} 
} 


换 句 话说， 对 于 任意 类 型 T 和 1U， 如 果 T: AsRef<U>， 则 &T: AsRef<U> 也 成 立 ， 即 简单 地 跟 
随 引 用 ， 然 后 一 如 既往 。 特 别 地 ， 由 于 str: AsRef<Path>， 因 此 &str: AsRef<Path> 也 成 
立 。 某 种 意义 上 讲 ， 这 可 以 看 成 检查 AsRef 在 类 型 变量 上 的 绑 定时 的 一 种 有 限制 的 解 引 用 
强制 转型 。 


基本 上 可 以 这 样 假定 ， 如 果 一 个 类 型 实现 了 AsRef<T>， 那 它 也 应 该 实现 AsMut<T>。 不 过 ， 
有 些 情况 下 这 样 并 不 合适 。 比 如 ， 前 面 曾 提 到 过 string 实现 了 AsRef<[u8]>， 这 设 问题 ， 
因为 每 个 String 都 对 应 着 一 个 字 市 缓冲 区 ， 而 从 这 个 缓冲 区 中 读 取 二 进 制 数 据 是 有 意义 
的 。 可 是 ，String 进一步 保证 其 包含 的 字 市 是 格式 良好 的 UTF-8 编码 的 Unicode 文本 。 如 
果 string 实现 了 AsMut<[u8]>， 就 相当 于 允许 调用 者 随意 修改 String 的 字 节 ， 结 果 可 能 
是 无 法 再 信任 String 是 格式 良好 的 UTF-8 了 。 因 此 ， 一 个 类 型 是 否 有 必要 实现 AsMut<T>， 
要 看 修改 了 T 之 后 是 否 会 影响 该 类 型 的 不 变性 约束 。 


虽然 AsRef 和 AsMut 都 很 简单 ， 但 它们 作为 标准 化 的 泛 型 特 型 可 以 避免 出 现 更 具体 的 转型 
特 型 。 如 果 可 以 实现 AsRef<Foo>， 就 不 要 定义 自己 的 AsFoo 特 型 。 



































13.8 Borrow 与 BorrowMut 


std: :borrow::Borrow 特 型 与 AsRef 类 似 : 如 果 一 个 类 型 实现 了 Borrow<T>， 那 么 它 的 
borrow 方 法 可 以 从 自身 有 效 地 借用 一 个 8T。 不 过 ，Borrow 增加 了 更 多 限制 : 只 有 当 8T 与 
它 所 借用 的 值 具有 同样 的 散 列 和 比较 特性 时 ， 一 个 类 型 才 可 以 实现 Borrow<T>。(Rust 不 会 
强制 这 一 点 ， 只 是 在 文档 中 这 样 规 定 了 这 个 特 型 的 意图 。) 这 使 得 在 处 理 散 列表 或 树 中 的 
键 , 或 者 处 理由 于 其 他 原因 将 被 散 列 或 比较 的 值 时 ，Borrow 都 很 有 用 。 

在 从 string 借用 值 时 ， 这 种 区 别 很 重要 。 比 如 ，String 实现 了 AsRef<str>、AsRef<[u8]> 
和 AsRef<Path>， 但 这 3 种 目标 类 型 通常 会 有 不 同 的 散 列 值 。 只 有 &str 切片 能 保证 与 对 应 
的 String 有 一 样 的 散 列 化 结果 ， 因 此 String 只 实现 了 Borrow<str>。 


Borrow 的 定义 跟 AsRef 几乎 一 样 ， 只 是 改 了 个 名 字 : 


trait Borrow<Borrowed: ?Sized> { 
fn borrow(&self) -> &Borrowed; 


} 
Borrow 的 用 意 是 针对 泛 型 散 列 表 及 其 他 关联 集合 类 型 的 特殊 情形 。 比 如 ， 假设 有 一 个 std 
: :collections::HashMap<String，i32> 将 字符 串 映 射 到 数值 。 这 个 表 的 键 是 String， 每 条 
记录 都 有 一 个 键 。 那 么 从 这 个 表 中 查询 一 条 记录 的 方法 的 签名 应 该 长 什么 样 ? 下面 是 一 种 
方案 : 


impl HashMap<K, V> where K: Eq + Hash 


















































fn get(&self, key: K) -> Option<&V> { ... } 
} 
思路 没 问 题 ， 要 查询 记录 ， 必 须 提供 一 个 适当 类 型 的 匹配 表 的 键 。 但 在 这 里 , K 是 String， 
即 这 个 签名 会 强制 每 次 调用 get 都 传人 一 个 String 值 。 这 显然 很 浪费 。 实 际 上 这 里 只 需要 


impl HashMap<K, V> where K: Eq + Hash 








fn get(&self, key: &K) -> Option<&V> { ... } 
} 


稍微 好 一 点 了 ， 但 现在 传人 的 键 必须 是 8string。 如 果 你 想 查询 一 个 常量 字符 串 ， 必 须 得 
这 样 写 : 

hashtable.get(&"twenty-two".to_string()) 
这 很 元 次: 先 在 堆 内 存 上 分 配 一 个 String 缓冲 区 ， 再 把 文本 复制 进去 ， 接 着 用 &string 来 
借用 它 ， 然 后 传 给 get， 最 后 把 它 清理 掉 。 
其 实 只 要 传人 的 值 能 产生 跟 键 的 类 型 可 比较 的 散 列 值 就 足够 了 。&str 应 该 完全 符合 这 个 条 
件 。 因 此 ， 下面 就 是 最 终 版 本 ， 也 是 标准 库 的 实现 : 


impl HashMap<K, V> where K: Eq + Hash 











{ 
fn get<Q: ?Sized>(&self, key: 8&Q) -> Option<&V> 
where K: Borrow<Q>, 
Q: Eq + Hash 
长 aie 
} 


换 句 话 说， 如 果 可 以 通过 8&Q 借用 记录 的 键 ， 而 且 引 用 的 散 列 和 比较 与 键 本 身 一 样 ， 那 么 
显然 &Q 应 该 是 可 以 接受 的 键 类 型 。 因 为 String 实现 了 Borrow<str> 和 Borrow<String>， 所 
以 这 个 最 终 版 本 的 get 允许 按 需 传 入 &String 或 &str 作为 键 。 

Vec<T> 和 [T: N] 实现 了 Borrow<[T]>。 所 有 类 字符 串 类 型 都 允许 借用 其 对 应 的 切片 类 型 : 
String 实现 了 Borrow<str>、PathBuf 实现 了 Borrow<Path>， 等 等 。 标 准 库 中 所 有 关联 集合 
类 型 都 使 用 Borrow 来 确定 什么 类 型 可 以 传 给 它们 的 查询 函数 。 

标准 库 中 包含 一 个 非 限 制 性 实现 ， 以 便 每 个 类 型 T 都 可 以 从 自身 借用 : T: Borrow<T>。 这 
样 就 确保 了 &K 始终 是 在 HashMap<K，V> 中 查询 记录 时 可 接受 的 类 型 。 

为 方便 起 见 ， 所 有 &mut T 类 型 也 都 实现 了 Borrow<T>， 跟 之 前 一 样 返 回 共享 引用 &8T。 这 样 
就 可 以 给 集合 查询 函数 传人 一 个 可 修改 引用 ， 而 无 须 再 重新 借用 一 个 共享 引用 ， 同 时 也 模 
拟 了 Rust 从 可 修改 引用 到 共享 引用 的 隐 式 转型 。 

BorrowMut 特 型 是 Borrow 针对 可 修改 引用 的 版 本 : 


trait BorrowMut<Borrowed: ?Sized>: Borrow<Borrowed> { 
fn borrow_mut(&mut self) -> &mut Borrowed; 



































} 
前 面 介 绍 的 实现 Borrow 所 要 具备 的 条 件 同 样 适 用 于 BorrowMut。 
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13.9 ”From 与 Into 


std: :convert::From 和 std: :convert::Into 特 型 表示 类 型 转换 ， 即 消费 一 种 类 型 的 值 ， 然 
后 返回 另 一 种 类 型 的 值 。AsRef 和 AsMut 特 型 是 从 一 种 类 型 借用 另 一 种 类 型 的 引用 ，From 



































和 Into 则 是 取得 它们 参数 的 所 有 权 ， 转 换 类 型 ， 再 把 结果 的 所 有 权 返 回 给 调用 者 。 
这 两 个 特 型 的 定义 是 对 称 的 : 


trait Into<T>: Sized { 
fn into(self) -> T; 





} 


trait From<T>: Sized { 
fn from(T) -> Self; 
} 








标准 库 自 动 实现 了 每 种 类 型 到 自身 的 简单 转换 ， 即 每 种 类 型 T 都 实现 了 From<T> 和 Into<T>。 
虽然 这 两 个 特 型 只 提供 了 做 同一 件 事 的 两 种 方式 ， 但 它们 因此 也 具有 了 不 同 的 用 途 。 











通常 ， 可 以 使 用 Into 让 函数 更 灵活 地 接收 参数 。 比 如 ， 如 果 这 样 写 代码 : 


use std::net::Ipv4Addr; 

fn ping<A>(address: A) -> std::io::Result<bool> 
where A: Into<Ipv4Addr> 

{ 


Let ipv4 _address = address.into(); 


} 


那么 ping 函数 不 仅 可 以 接收 Ipv4Addr 作为 参数 ， 也 可 以 接收 u32 或 [u8; 4] 数组 ， 因 为 


后 两 个 类 型 为 方便 起 见 也 都 实现 了 Into<Ipv4Addr>。( 有 时 候 把 IPv4 地 址 当成 一 个 








32 位 值 


或 者 一 个 4 字 节 数组 来 处 理会 更 有 用 。) 因为 ping 只 知道 address 实现 了 Into<Ipv4Addr>， 
所 以 在 调用 into 时 也 不 用 指定 你 想 要 什么 类 型 。 只 有 一 种 类 型 可 能 有 用 ， 所 以 类 型 推断 会 








帮 你 把 这 事 给 干 了 。 











与 前 面 介绍 的 AsRef 一 样 ， 这 里 的 效果 非常 像 在 C++ 中 重 载 了 一 个 函数 。 基 于 前 玫 





| 的 ping 





国 数 定义 ， 可 以 像 下 面 这 样 以 多 种 类 型 调用 它 : 


println!("{:?}", ping(Ipv4Addr::new(23,21, 68, 141)));  // 传人 Ipv4Addr 
println!("{:?}", ping([66, 146, 219, 98])); // 传 入 [u8; 4] 
println!("{:?}", ping(Oxd076eb94 u32)); // 传 入 u32 








不 过 ，From 特 型 的 角色 却 不 一 样 ， 其 fron 方法 就 像 一 个 泛 型 构造 函数 ， 可 以 基于 其 他 值 


产生 一 个 当前 类 型 的 实例 。 比 如 ， 与 Ipv4Addr 有 from_array 和 from_u32 两 个 方 
From 只 实现 了 From<[u8;4]> 和 From<u32>， 于 是 才 人 允许 这 样 写 : 


Ipv4Addr: :from([66, 146, 219, 98]); 
Ipv4Addr: :from(Oxd076eb94_uy32); 


let addr1 
let addr2 


这 也 就 是 说 ， 可 以 让 类 型 推断 帮 有 我 们 整理 要 使 用 的 实现 。 














法 不 同 ， 





有 了 Fron 的 适当 实现 ， 标 准 库 可 以 自动 实现 对 应 的 Into 特 型 。 在 定义 自己 的 类 型 时 ， 如 
果 它 有 只 接收 一 个 参数 的 构造 函数 ， 那 应 该 将 它们 写成 针对 适当 类 型 的 From<T> 的 实现 ， 
然后 就 能 自动 获得 对 应 的 Into 实现 。 

因为 fron 和 into 转换 方法 取得 它们 参数 的 所 有 权 ， 所 以 转换 过 程 中 可 以 使 用 原始 值 的 资 
源 来 构建 转换 后 的 值 。 比 如 ， 假 设 有 如 下 代码 : 


Let text = "BeautifuL Soup" .to_string(); 
Let bytes: Vec<u8> = text.into(); 


这 里 ，String 对 Into<Vec<u8>> 的 实现 只 需 找到 string 的 堆 缓冲 区 并 重新 调整 用 途 ， 无 须 
更 改 ， 只 是 将 其 作为 向 量 元 素 的 缓冲 区 返回 。 这 种 转换 无 须 分 配 或 复制 文本 。 这 也 是 转移 
可 以 提高 实现 效率 的 另 一 个 例子 。 


以 上 转换 也 是 将 较 受 限 类 型 值 放宽 为 更 灵活 类 型 值 的 一 种 不 错 的 方式 ， 不 会 影响 受 限 类 型 
的 保证 。 比 如 ，String 保证 其 内 容 始 终 是 有 效 的 UTF-8， 其 修改 方法 通过 谨慎 的 限制 确保 
用 户 不 会 引入 错误 的 UTF-8。 不 过 这 个 例子 有 效 地 将 一 个 string“ 降 级 ”为 了 一 个 纯 字 节 
块 ， 我 们 可 以 对 它 进行 任意 操作 。 比 如 ， 可 以 压缩 它 ， 或 者 将 它 与 其 他 非 UTF-8 二 进 制 数 
据 组 合 。 因 为 into 取得 的 是 参数 的 值 ， 所 以 text 在 转换 之 后 就 变 成 未 初始 化 状态 了 。 这 
意味 着 我 们 可 以 自由 访问 之 前 string 的 缓冲 区 ， 而 不 会 破坏 任何 现 有 的 Strtng。 


不 过 ， 低 开销 转换 并 非 Into 和 Fron 的 承诺 。 尽 管 AsRef 和 AsMut 转换 预计 开销 不 大 ， 但 
From 和 Into 转换 可 以 分 配 、 复 制 或 处 理 值 的 内 容 。 比 如 ，String 实现 了 From <&str>， 可 
以 将 字符 串 切 片 复制 到 一 个 在 堆 内 存 上 新 分 配 的 缓冲 区 并 返回 String。 而 std: :coLLections 
: :BinaryHeap<T> 实现 了 From<Vec<T>>， 它 可 以 根据 其 算法 的 需要 对 元 素 进 行 比较 和 重新 
排序 。 


要 注意 的 是 ，From 和 Into 仅 限 于 永 不 失败 的 转换 。 单 从 方法 类 型 参数 的 签名 ， 根 本 看 不 
出 来 某 个 转换 会 失败 。 为 了 让 自 定义 类 型 在 向 内 或 向 外 转换 时 处 理 可 能 的 失败 ， 最 好 让 函 
数 或 方法 返回 Result 类 型 。 

在 From 和 Into 被 添加 到 标准 库 之 前 ，Rust 代码 中 到 处 可 见 临 时 的 转换 特 型 和 构造 方法 ， 
每 种 类 型 都 有 一 套 。From 和 Into 把 简化 类 型 使 用 的 惯例 固定 了 下 来 ， 不 仅 实现 者 可 以 遵 
循 ， 而 且 类 型 的 用 户 也 习以为常 。 


13.10 ToOwned 


给 定 一 个 引用 ， 产 生 其 引用 目标 的 所 有 型 副本 的 通常 方式 是 调用 clone 方法 ， 当 然 前 提 是 
这 个 类 型 实现 了 std::clone::Clone。 但 是 ， 如 果 你 想 克隆 一 个 &str 或 &[i32] 怎么 办 ? 你 
想 要 的 可 能 是 一 个 String 或 Vec<i32>, 但 这 是 Clone 的 定义 所 不 允许 的 。 按 照 定义 ， 克 隆 
一 个 8T 必须 返回 一 个 类 型 T 的 值 ， 而 str 和 [u8] 都 是 非 固定 大 小 的 。 因 此 它们 甚至 都 不 
是 函数 可 以 返回 的 类 型 。 


std: :borrow: :To0wned 特 型 针对 这 个 问题 提供 了 稍微 宽松 一 点 的 方案 ， 可 以 把 引用 转换 为 
所 有 型 的 值 : 



































































































































trait ToOwned { 

type Owned: Borrow<Self>; 

fn to_owned(&seLf) -> Self::Owned; 
} 


与 clone 必须 返回 Self 不 同 ，to_owned 可 以 返回 能 够 借用 为 &Self 的 任何 类 型 ，0wned 类 
型 必须 实现 Borrow<Self>。 可 以 从 Vec<T> 借 用 一 个 &[T]， 此 [T] 可 以 实现 ToOwned 


<0wned=Vec<T>>， 只 要 T 实 现 Clone 即 可 ， 这 样 就 可 以 把 切片 的 元 素 复 制 到 向 量 中 。 类 似 
地 ，str 实现 了 ToOwned<0wned=String>、Path 实现 了 To0wned<0wned=pPathBuf>， 等 等 。 


13.11 ”Borrow 与 ToOwned 实 例 : 谦逊 的 奶牛 (Cow) 


要 想 用 好 Rust， 必 须 把 与 所 有 权 相 关 的 问题 想 清楚 ， 比 如 一 个 函数 到 底 应 该 按 引 用 还 是 按 
值 接收 参数 。 通 常 ， 可 以 选择 其 中 一 种 方式 ， 而 参数 的 类 型 反映 了 你 的 决定 。 但 在 茶 些 情 
况 下 ， 只 能 到 程序 运行 时 才能 决定 到 底 是 借用 还 是 取得 所 有 权 更 合适 。std: :borrow: :Cow 
(clone on write， 写 时 克隆 ) 类 型 为 此 提供 了 一 种 解决 方案 。 


std: :borrow: :Cow 的 定义 如 下 : 


enum Cow<'a, B: ?Sized + 'a> 
where B: ToOwned 





























{ 
Borrowed(&'a B), 
Owned(<B as ToOwned>::Owned), 


} 


Cow<B> 可 以 借用 对 B 的 一 个 共享 引用 ， 也 可 以 拥有 一 个 值 ， 然 后 再 借用 这 样 一 个 引用 。 因 
为 Cow 实现 了 Deref， 所 以 可 以 把 它 当 成 一 个 对 B 的 共享 引用 ， 进 而 调用 任何 方法 。 如 果 
它 是 owned， 就 借用 对 这 个 所 有 值 的 共享 引用 ， 如 果 它 是 Borrowed， 就 交 出 它 持 有 的 引用 。 


调用 to_mut 方法 也 可 以 取得 对 一 个 Cow 值 的 可 修改 引用 ， 此 时 方法 返回 的 是 &mut B。 如 果 
Cow 恰好 是 Cow: :Borrowed，to_mut 就 直接 调用 引用 的 to_owned 方法 ， 取 得 对 引用 目标 的 
所 有 型 副本 ， 将 Cow 改 为 Cow: :0wned， 并 借用 对 这 个 新 所 有 值 的 可 修改 引用 。 这 就 是 “ 写 
时 克隆 ”。 


类 似 地 ，Cow 的 into_owned 方法 在 必要 时 会 将 引用 提升 为 所 有 型 的 值 ， 然 后 返回 它 ， 将 所 
有 权 转 移 给 调用 者 ， 并 在 此 过 程 中 消费 Cow。 


Cow 的 一 个 常见 用 途 是 返回 静态 分 配 的 字符 串 常 量 或 者 计算 的 字符 串 。 假 设 你 需要 将 一 个 
错误 枚 举 转换 为 一 条 消息 。 大 多 数 变 体 可 以 用 固定 大 小 的 字符 串 来 处 理 ， 但 有 些 也 需要 在 
消息 中 包含 额外 的 数据 。 可 以 返回 一 个 Cow<'static，str>: 


use std::path::PathBuf; 

use std::borrow::Cow; 

fn describe(error: &Error) -> Cow<'static, str> { 

match *error { 

Error::O0utofMemory => "out of memory".into(), 
Error::StackOverflow => "stack overflow".into(), 
Error::MachineOnFire => "machine on fire".into(), 
Error::Unfathomable => "machine bewildered".into(), 
















































































Error::FileNotFound(ref path) => { 
format!("file not found: {}", path.display()).into() 
} 


} 
代码 中 使 用 了 Cow 对 Into 的 实现 来 构建 想 要 的 值 。match 语句 的 大 多 数 分 支 返 回 一 个 
Cow: :Borrowed，3| 用 一 个 静态 分 配 的 字符 串 。 但 对 于 FileNotFound 变 体 ， 则 使 用 format! 
构建 了 一 个 包含 给 定 文件 名 的 消息 。 这 个 match 语句 的 分 支 产 生 的 是 一 个 Cow: :0wned 值 。 
describe 的 调用 者 如 果 不 需 要 修改 返回 值 ， 可 以 把 Cow 当成 一 个 &str: 

printLn!("Disaster has struck: {}", describe(&error)); 
而 需要 一 个 所 有 型 值 的 调用 者 也 可 以 很 容易 得 到 它 : 


let mut log: Vec<String> = Vec::new(); 

















log.push(describe(&error).into_owned()); 


在 Cow 的 帮助 下 ，describe 及 其 调用 者 得 以 把 内 存 分 配 推迟 到 了 真正 必要 的 时 候 。 
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闭 包 





拯救 环境 | 今天 就 创建 闭 包 | 
一 一 Cormac Flanagan 
排序 整数 向 量 很 简单 : 
integers. sort(); 
然而 现实 当中 ， 当 我 们 想 要 排序 某 些 数 据 时 ， 这 些 数据 往往 不 是 整数 向 量 。 通 常 ， 我 们 会 
获取 某 种 记录 ， 但 不 能 使 用 其 内 置 的 sort 方法 : 


struct City { 
name: String, 
population: i64, 
country: String, 








} 


fn sort cities(cities: &mut Vec<City>) { 
cities.sort(); // 错误 : 根据 什么 进行 排序 ? 
} 


Rust 抱怨 说 City 没有 实现 std: :cmp: :0rd。 为 此 ， 需 要 指定 按 什么 顺序 来 排序 ， 比 如 : 
/// 按 信 口 排 序 城市 的 辅助 函数 


fn city_population descending(city: &City) -> i64 { 
-City.popuLation 





} 


fn sort_cities(cities: &mut Vec<City>) { 
cities.sort by_key(city_population_descending); // 没 问 题 了 
} 
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这 里 的 辅助 函数 city_population_descending 接收 City 记录 ， 然 后 提取 出 它 的 键 (key ) ， 
之 后 要 通过 这 个 键 对 数据 进行 排序 。( 这 里 返回 负 值 是 因为 sort 会 增 序 排列 数值 ， 而 我 们 
想 要 的 是 减 序 : 人 口 最 多 的 城市 排 前 面 。) sort_by_key 方法 将 这 个 键 函 数 作 为 参数 。 
这 样 可 以 达到 目的 。 但 编写 这 个 辅助 函数 的 更 简洁 方式 是 把 它 的 逻辑 写成 闭 包 ， 即 一 个 
名 函数 表达 式 : 

fn sort cities(cities: &mut Vec<City>) { 


cities.sort by_key(|city| -city.population); 


} 


这 里 的 |city| -city.population 就 是 闭 包 。 它 接收 一 个 参数 ctty， 返 回 -city.population。 
Rust 会 根据 使 用 闭 包 的 上 下 文 推断 参数 类 型 和 返回 类 型 。 


标准 库 中 还 有 一 些 特性 也 接收 闭 包 。 


Iterator 的 map 和 filter 方法 ， 用 于 操作 顺序 数据 ， 第 15 章 会 介绍 这 些 方法 。 
启动 新 系统 线程 的 thread: :spawn 等 线程 API。 并 发 的 核心 是 在 线程 间 交 换 工 作 ， 而 闭 
包 可 以 方便 地 表示 工作 单元 。 第 19 章 会 介绍 这 些 特性 。 

。 某 些 方法 会 在 必要 时 计算 默认 值 ， 比 如 HashMap 的 or_insert_with 方法 。 这 个 方法 会 从 
HashMap 中 获取 一 个 值 或 者 创建 一 个 值 ， 用 于 计算 默认 值 比较 耗 时 的 情形 。 默 认 值 以 闭 
包 形 式 传 和 人， 但 只 会 在 必须 创建 新 值 时 调用 。 


当然 ， 如 今 匿名 函数 已 经 非常 常见 了 ， 就 连 最 初 本 来 没有 这 个 特性 的 Java、C#、Python 和 
C++ 也 都 支持 了 。 接 下 来 ， 假 设 我 们 已 经 了 解 了 匿名 函数 ， 而 专注 于 解释 Rust 的 闭 包 有 
什么 不 同 。 本 章 会 介绍 如 何在 标准 库 方法 中 使 用 闭 包 、 财 包 如 何在 其 作用 域 中 “捕获 ” 变 
量 、 如 何 编写 自己 的 以 闭 包 为 参数 的 函数 和 方法 ， 以 及 存储 闭 包 以 便 将 来 用 作 回调 。 总 
之 ， 本 章 会 解释 Rust 闭 包 的 工作 原理 ， 以 及 为 什么 它 的 速度 超出 想象 。 


x7nR 旦 
14.1 捕获 变量 
闭 包 可 以 使 用 属于 包含 函数 的 数据 。 例 如 : 
11/ 按 几 个 不 同 的 统计 指标 排序 


fn sort by_statistic(cities: &mut Vec<City>, stat: Statistic) { 
cities.sort by _ key(|city| -city.get statistic(stat)); 



























































} 


这 里 的 闭 包 使 用 了 stat， 而 包含 函数 sort_by_statistic 拥有 这 个 变量 。 对 此 ， 我 们 说 闭 
包 “捕获 ” 了 stat。 这 是 闭 包 的 几 个 经 典 特性 之 一 ，Rust 自然 也 支持 。 但 在 Rust 中 ， 这 
个 特性 会 受到 一 些 限 制 。 


在 大 多 数 支 持 闭 包 的 语言 中 ， 垃 圾 回收 扮演 着 重要 角色 。 例 如 下 面 这 段 JavaScript 代码 : 
// 启动 重 排 城市 表格 行 的 动画 


function startSortingAnimation(cities, stat) { 
// 用 于 排序 表格 的 辅助 函数 
// 注意 ， 这 个 函数 引用 了 stat 
function keyfn(city) { 
return city.get statistic(stat); 
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} 


if (pendingSort) 
pendingSort.cancel(); 


// 现在 启动 动画 ， 传 入 keyfn 
// 后 面 排序 算法 会 调用 keyfn 


pendingSort = new SortingAnimation(cities, keyfn); 














上 


这 里 闭 包 keyfn 保存 在 了 新 的 SortingAnimation 对 象 中 ， 并 会 在 startSortingAnimation 返 
回 后 被 调用 。 正 常情 况 下 ， 一 个 国 数 返 回 后 ， 其 所 有 变量 和 参数 都 会 因 超 出 作用 域 而 被 销 
毁 。 但 在 这 里 ，JavaScript 引擎 必须 保留 stat， 因 为 闭 包 引用 了 它 。 大 多 数 JavaScript 引擎 
会 把 stat 分 配 到 堆 上 ， 然 后 交 给 垃圾 回收 程序 以 后 再 回收 。 


Rust 没有 垃圾 回收 ， 那 如 何 实现 这 个 特性 呢 ? 为 回答 这 个 问题 ， 先 来 看 两 个 例子 。 


14.1.1 借用 值 的 闭 包 
首先 ， 再 来 看 看 本 节 开 头 的 例子 ， 


fn sort by_statistic(cities: &mut Vec<City>, stat: Statistic) { 
cities.sort by_ key(|city| -city.get statistic(stat)); 





















































} 


这 时 候 ，Rust 在 创建 闭 包 时 会 自动 借用 对 stat 的 引用 。 这 合情合理 : 闭 包 引 用 了 stat， 
因此 必须 有 一 个 对 它 的 引用 。 


剩 下 的 就 简单 了 。 闭 包 也 遵守 第 5 章 描 述 的 借用 和 生命 期 规划。 特别 地 ， 因 为 闭 包 包含 对 
stat 的 引用 ， 所 以 Rust 不 会 让 它 的 存活 期 超过 stat。 财 包 只 在 排序 期 间 使 用 ， 因 此 这 个 
例子 没什么 问题 。 


简单 来 说 ，Rust 使 用 生命 期 而 不 是 垃圾 回收 确保 代码 安全 ， 但 Rust 的 方式 更 快 。 即 使 是 
快速 的 GC 分 配 也 会 比 Rust 把 stat 保存 在 栈 上 慢 。 


14.1.2 盗用 值 的 闭 包 
第 二 个 例子 就 没 那 么 简单 了 : 


use std::thread; 























fn start_sorting_thread(mut cities: Vec<City>, stat: Statistic) 
-> thread: :JoinHandle<Vec<City>> 


{ 
Let key fn = |city: &City| -> i64 { -city.get statistic(stat) }; 
thread::spawn(|| { 
cities.sort by_key(key_fn); 
cities 
}) 
} 





这 跟前 面 JavaScript 的 例子 有 点 像 : thread: :spawn 接收 一 个 团 包 ， 并 在 新 的 系统 线程 中 调 
用 这 个 闭 包 。 注 意 ，|| 表示 闭 包 没 有 参数 。 
新 线程 与 调用 程序 并 行 运行 。 闭 包 返 回 后 ， 新 线程 退出 。( 闭 包 的 返回 值 会 包装 在 
JoinHandle 中 返回 给 调用 线程 。 第 19 章 会 介绍 JotnHandtLe。) 
同样 ， 闭 包 key_fn 包含 对 stat 的 引用 。 但 这 一 次 ，Rust 不 能 保证 安全 使 用 。 为 此 ， 它 会 
拒绝 这 个 程序 : 

error[E0373]: cLosure may outlive the current function, but it borrows “stat `， 


which is owned by the current function 
--> CLosures_sort_thread.rs:33:18 








33 | Let key fn = |city: &City| -> i64 { -city.get statistic(stat) }; 


| 
| 
| NMANMNMNMNNNNNNNNNNNNANANAN 人 人 AA 人 人 \ 
| 
| 


| ‘stat” is borrowed here 
may outlive borrowed value ‘stat. 


实际 上 这 里 有 两 个 问题 ， 因 为 cities 也 属于 不 安全 的 共享 。 很 简单 ，thread: :spawn 创建 
的 新 线程 不 能 保证 自己 在 cities 和 stat 被 销毁 (函数 结束 ) 前 完成 任务 。 

这 两 个 问题 的 解决 方案 相同 : 告诉 Rust 把 cities 和 stat 转移 到 使 用 它们 的 闭 包 中 ， 而 不 
要 再 引用 它们 。 


fn start_sorting_thread(mut cities: Vec<City>, stat: Statistic) 
-> thread: :JoinHandle<Vec<City>> 























{ 
Let key fn = move |city: &City| -> i64 { -city.get statistic(stat) }; 
thread::spawn(move || { 
cities.sort_by_key(key_fn); 
cities 
}) 
} 








这 里 唯一 的 改动 就 是 在 两 个 闭 包 前 面 各 自 加 了 一 个 move 关键 字 。move 关键 字 告 诉 Rust， 
这 个 闭 包 不 是 在 借用 它 使 用 的 变量 ， 而 是 要 把 它 偷 走 。 


第 一 个 团 包 key_fn 获得 了 stat 的 所 有 权 。 而 第 二 个 闭 包 获 得 了 cities 和 key_fn 的 所 有 权 。 


因此 ，Rust 为 闭 包 提供 了 两 种 从 包含 函数 取得 数据 的 方式 ， 转 移 和 借用 。 实 际 上 到 这 儿 也 

就 没什么 可 说 的 了 ， 闭 包 也 遵循 第 4 章 和 第 5 章 已 经 介绍 过 的 转移 和 借用 规则 。 下 面 稍微 

分 析 一 下 。 

正如 这 门 语言 中 的 其 他 地 方 一 样 ， 如 果 闭 包 转 移 了 一 个 可 复制 的 值 (如 132)， 那 它 会 
复制 该 值 。 因 此 ， 如 果 Statistic 恰好 是 一 个 可 复制 类 型 ， 那 么 在 创建 使 用 它 的 转移 闭 
包 之 后 ， 照 样 还 可 以 使 用 stat。 

。 像 Vec<City> 这 样 的 不 可 复制 类 型 值 才 会 真正 转移 。 上 面 的 代码 通过 转移 闭 包 把 cities 
转移 到 了 新 线程 中 。 在 创建 这 个 闭 包 的 代码 后 面 ，Rust 不 会 再 让 我 们 访问 cities。 
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。 巧合 的 是 ， 上 面 的 代码 在 闭 包 转移 cittes 之 后 也 不 需要 使 用 ctttes 了 。 假 如 还 需要 使 
用 cittes ,解决 办 法 也 很 简单 。 可 以 告诉 Rust 克隆 cities 并 将 副本 保存 到 另 一 个 变量 中 。 
闭 包 只 能 偷 走 它 自己 引用 的 那个 副本 。 

在 接受 Rust 严格 的 规则 之 后 ， 我 们 也 换 来 了 重要 的 收益 ， 线程 安全 。 这 完全 归功 于 向 量 被 

转移 了 ， 而 不 是 在 多 个 线程 间 共 享 。 如 果 是 共享 的 ， 那 么 在 新 线程 修改 它 时 ， 老 线程 也 不 

会 放手 。 


14.2 ”函数 与 闭 包 类 型 


本 章 中 ， 国 数 和 闭 包 被 当 作 值 来 使 用 。 自 然 ， 这 意味 着 它们 也 有 自己 的 类 型 。 例 如 : 


fn city_population descending(city: &City) -> i64 { 
-City.popuLation 





























} 
这 个 函数 接收 一 个 参数 (&city) ， 返 回 一 个 164 值 。 因 此 它 的 类 型 就 是 fn(&City) -> 164。 


可 以 像 使 用 其 他 任何 值 一 样 使 用 函数 。 可 以 把 函数 保存 在 变量 里 。 可 以 使 用 任何 常用 的 
Rust 语法 计算 函数 值 : 
Let my_key_fn: fn(&City) -> i64 = 
if user.prefs.by_population { 
city_popuLation_descending 
} elsef 
city_monster_attack_risk_descending 


} 








cities.sort_ by_key(my_key_fn); 


结构 体 可 以 包含 函数 类 型 的 字段 。 泛 型 类 型 如 Vec 可 以 存储 一 批 函数 ， 只 要 它们 的 fn 类 型 
一 样 就 行 。 函 数值 很 小 ， 一 个 fn 值 就 是 这 个 函数 机 器 码 的 内 存 地 址 ， 与 C++ 中 的 函数 指 
针 类 似 。 
一 个 函数 可 以 接收 男 一 个 函数 作为 参数 。 例 如 : 

/// 传人 一 组 城市 和 一 个 测试 函数 ， 

/// 返回 满足 条 件 的 所 有 城市 


fn count_selected cities(cities: &Vec<City>, 
test_fn: fn(&City) -> bool) -> usize 





{ 
let mut count = 0; 
for city in cities { 
if test fn(city) { 
count += 1; 
} 
} 
count 
} 


/// 一 个 测试 函数 的 例子 。 注 意 ， 这 个 函数 的 类 型 是 
/// fn(&City) -> bool， 跟 count_selected cities 








/// 函数 的 参数 test_fn 一 致 
fn has_monster_attacks(city: &City) -> bool { 
city.monster_attack_risk > 0.0 


3 
// 看 一 下 多 少 城市 有 被 怪物 袭击 的 风险 ? 


let n = count_selected cities(&my cities, has_monster_attacks); 
如 果 你 熟悉 C/C++ 中 的 函数 指针 ， 就 会 发 现 Rust 的 函数 值 实际 上 就 是 指针 。 
虽然 如 此 ， 听 到 闭 包 居 然 与 国 数 不 是 同一 种 类 型 你 一 定 会 惊讶 : 


Let limit = preferences.acceptable monster_risk(); 
let n = count_ selected cities( 
&my_cities, 
|city| city.monster_attack_risk > limit); // 错误 : 类 型 不 匹配 


第 二 个 参数 会 导致 类 型 错误 。 为 支持 闭 包 ， 必 须 修改 函数 的 类 型 签名 。 修 改 后 应 该 类 似 这 样 : 


fn count_selected cities<F>(cities: &Vec<City>, test fn: F) -> usize 
where F: Fn(&City) -> bool 




















{ 
let mut count = 0; 
for city in cities { 
if test fn(city) { 
count += 1; 
} 
} 
count 
} 


这 里 只 改 了 count_selected_cities 的 类 型 签名 ,没有 改 函 数 体 。 新 版 本 是 一 个 泛 型 函数 ， 
接收 一 个 任意 类 型 F 的 参数 test_fn， 而 F 必须 实现 特 型 Fn(&City) -> bool。 所 有 以 一 个 
&City 为 参数 且 返 回 布尔 值 的 函数 和 闭 包 都 会 自动 实现 这 个 特 型 。 

fn(&City) -> booL // fn 类 型 ( 仅 函 数 ) 

Fn(&City) -> booL // Fn 特 型 (包括 函数 和 闭 包 ) 
这 个 特殊 语法 内 置 在 这 门 语言 中 。 中 间 的 -> 和 后 面 的 返回 值 类 型 是 可 选 的 。 如 果 省 略 ， 
则 返回 值 类 型 为 ()。 
新 版 本 的 count_selected_cities 可 以 接收 函数 ， 也 可 以 接收 闭 包 : 

count_selected cities( 


&my_cities, 
has_monster_attacks); // 没 问 题 








count_selected cities( 
&my_cities， 
|city| city.monster_attack_risk > limit); // 同样 没 问题 


为 什么 第 一 次 尝试 不 行 呢 ?” 因 为 闭 包 可 以 调用 ,但 它 不 是 fn。 闭 包 |city| city.monster_ 
attack_risk > limit 有 自己 的 类 型 ， 但 并 不 是 fn。 


事实 上 ， 你 写 的 每 个 闭 包 都 有 自己 的 类 型 ， 因 为 闭 包 可 能 包含 (从 包含 作用 域 中 借 来 或 偷 
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来 的 ) 数据 。 这 可 能 是 任意 多 个 变量 ， 这 些 变量 也 可 能 是 任何 类 型 。 因 此 编译 器 会 为 每 个 
闭 包 创 建 一 个 临时 类 型 ， 大 到 足以 存储 它 的 数据 。 任 何 两 个 闭 包 的 类 型 都 不 相同 。 但 所 有 
闭 包 都 会 实现 Fn 特 型 ， 例 子 中 的 闭 包 就 实现 了 Fn(&City) -> bool。 


由 于 每 个 闭 包 都 有 自己 的 类 型 , 因此 使 用 闭 包 的 代码 通常 需要 是 泛 型 的 , 像 count_selected_ 
cities 一 样 。 每 次 都 要 写 出 泛 型 类 型 显得 有 点 麻烦 ， 下 一 节 会 解释 这 样 设 计 的 好 处 。 


14.3 闭 包 的 性 能 


Rust 闭 包 的 设计 保证 它 非 常 快 ， 比 函数 指针 还 要 快 ， 快 到 完全 可 以 用 在 强度 和 性 能 要 求 极 
高 的 环境 下 。 如 果 你 熟悉 C++ 的 lambda 表达 式 ， 就 会 发 现 Rust 闭 包 跟 它 一 样 快 且 简 洁 ， 
但 更 安全 。 


在 大 多 数 语言 中 ， 闭 包 是 分 配 在 堆 上 ， 动 态 分 派 ， 然 后 由 垃圾 回收 程序 负责 回收 的 。 因 此 
创建 、 调 用 和 回收 它们 都 会 多 花 那 么 一 点 点 CPU 时 间 。 更 麻烦 的 是 ， 编 译 器 很 难 对 闭 包 
应 用 行内 化 优化 策略 以 减少 函数 调用 并 进而 应 用 其 他 优化 。 总 之 ， 这 些 语言 中 的 闭 包 可 以 
慢 到 需要 你 考虑 把 它们 从 紧凑 的 内 部 循环 tight inner loop) 中 移出 来 。 

Rust 闭 包 完 全 没有 这 些 性 能 上 的 缺点 。Rust 就 没有 垃圾 回收 。 与 Rust 中 的 其 他 特性 一 样 ， 
闭 包 不 会 被 分 配 到 堆 上 ， 除 非 你 把 它们 装 到 Box、vVec 或 其 他 容器 里 。 而 且 因 为 每 个 闭 包 都 
有 一 个 不 同 的 类 型 ， 所 以 Rust 编译 器 只 要 知道 了 你 所 调用 闭 包 的 类 型 ， 就 可 以 将 该 闭 包 的 
代码 行内 化 。 这 样 在 紧凑 循环 里 使 用 亲 包 就 没什么 问题 了 ，Rust 程序 经 常 热衷 于 这 样 做 ， 
正如 第 15 章 将 展示 的 那样 。 

图 14-1 展示 了 Rust 闭 包 在 内 存 中 的 布局 。 图 的 上 方 是 闭 包 会 引用 的 两 个 局 部 变量 : 字符 
串 food 和 值 为 27 的 简单 枚 举 weather。 
























































food weather 


letfood = "tacos"; 
let weather = Weather::Tornadoes; tacos | 
(a) |city| city.eats(food) && 
city.has(weather) 本 看 时 宣 
(b) move |city| city.eats(food) && 
city.has(weather) "tacos” | 
(0 |city| city.eats("crawfish") = 


14-1; 闭 包 的 内 存 布局 











闭 包 (a) 使 用 了 这 两 个 变量 。 显 然 ， 这 里 是 想 查找 既 有 玉米 饼 (taco) 又 有 龙卷风 (tornado) 
的 城市 。 在 内 存 中 ， 这 个 闭 包 类 似 于 一 个 小 结构 体 ， 其 包含 对 它 所 使 用 变量 的 引用 。 


注意 ， 这 里 没有 包含 指向 其 代码 的 指针 。 这 是 不 必要 的 ， 只 要 Rust 知道 闭 包 的 类 型 ， 就 知 
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道 调 用 它 时 该 执行 什么 代码 。 
闭 包 (b) 几乎 完全 相同 ， 只 不 过 它 是 一 个 转移 闭 包 ， 因 此 会 包含 实际 的 值 而 非 引 用 。 


闭 包 (c) 没有 用 到 其 环境 中 的 任何 变量 。 此 时 结构 体 是 空 的 ， 因 此 这 个 闭 包 根本 不 会 占用 
内 存 。 


如 图 所 示 ， 这 些 闭 包 都 不 怎么 占 空间 。 但 就 算 那 么 点 字 市 在 实践 中 也 不 是 总 会 用 到 。 编 译 
器 经 常会 把 对 闭 包 的 调用 行内 化 ， 这 样 就 连 图 中 所 示 的 小 结构 体 也 会 被 优化 掉 。 


14.5 节 将 介绍 如 何在 堆 上 分 配 闲 包 并 通过 特 型 对 象 动态 调用 它们 。 这 样 会 稍微 慢 一 点 ， 但 
仍然 跟 其 他 特 型 对 象 一 样 快 。 


14.4 闭 包 和 安全 


接 下 来 主要 介绍 闭 包 与 Rust 安全 系统 的 关系 。 正 如 本 章 前 面 所 讲 的 ， 闭 包 主 要 就 是 在 创建 
的 时 修 可 能 转移 或 借用 被 捕获 的 变量 。 但 这 样 造成 的 影响 并 不 十 分 明显 ， 特 别 是 在 闭 包 清 
除 或 修改 捕获 的 值 时 。 


14.4.1 亲 值 的 闭 包 
前 面 介绍 了 借用 值 的 闭 包 ， 也 介绍 了 盗用 值 的 闭 包 ， 接 下 来 将 介绍 杀 值 的 闭 包 。 


当然 ,“ 杀 值 ”并 不 是 真正 恰当 的 术语 。 在 Rust 中 ， 我 们 说 清除 (drop) 值 。 最 直观 的 方 
式 就 是 调用 drop(): 


let my_str = "hello".to_string(); 
Let f = || drop(my_str); 


在 调用 f 时，my_str 会 被 清除 。 
















































































如 果 调 用 它 两 次 会 怎么 样 ? 
f(); 
f(); 








下 面 来 分 析 一 下 。 第 一 次 调用 f， 它 请 除了 my_str， 这 意味 着 会 释放 存储 字符 串 的 内 存 ， 
交还 给 系统 。 第 二 次 调用 f， 同 样 的 操作 又 会 执行 一 和 志 。 这 就 是 C++ 中 会 触发 未 定义 行为 
的 经 典 错误 : 重复 释放 (double free ) 。 
在 Rust 中 清除 一 个 String 两 次 也 是 件 坏事 。 好 在 Rust 并 不 容易 欺骗 : 

f(); // 没 问题 

f(); // 错误 : 使 用 转移 的 值 
Rust 知道 这 个 闭 包 不 能 被 调用 两 次 。 
一 个 闭 包 只 能 被 调用 一 次 ， 这 看 起 来 确实 是 一 件 离 奇 的 事 。 但 本 书 已 经 把 所 有 权 和 生命 期 
介绍 得 非常 详细 了 。 值 会 被 用 尽 ( 即 转移 ) 是 Rust 的 一 个 核心 概念 。 这 个 概念 适用 于 Rust 
中 的 一 切 ， 闭 包 当 然 也 不 例外 。 
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14.4.2 FnOnce 
下 面 再 试 试 欺骗 Rust， 让 它 两 次 清除 一 个 String。 这 次 使 用 的 泛 型 函数 如 下 : 


fn call_twice<F>(closure: F) where F: Fn() { 
closure(); 
closurel(); 


} 


可 以 给 这 个 函数 传 入 任何 实现 Fn() 特 型 的 闭 包 。 换 句 话 说 ， 就 是 不 接收 参数 且 返 回 () 的 
闭 包 。( 与 函数 一 样 ， 如 果 返 回 值 类 型 是 () 则 可 以 省 略 。Fn() 是 对 Fn() -> () 的 简写 。) 


接 下 来 ， 如 果 把 前 面 那 个 不 安全 的 闭 包 传 给 这 个 泛 型 函数 会 怎样 ? 


let my_str = "hello".to_string(); 
Let f = || drop(my_str); 
call_twice(f); 


同样 ， 这 个 闭 包 在 被 调用 时 会 清除 my_str。 调 用 它 两 次 就 是 重复 释放 。 但 这 次 ，Rust 又 没 
有 上 当 ; 


error[E0525]: expected a closure that implements the ‘Fn trait, but 
this closure only implements ‘FnOnce. 
--> Closures_twice.rs:12:13 
| 
125 | let f = || drop(my_str); 
| 人 八 八 八 八 八 八 八 八 八 八 八 八 八 八 
| 
note: the requirement to implement “Fn derives from here 
--> Closures_twice.rs:13:5 
| 
13 | call_twice(f); 


| 八 八 八 八 八 八 八 八 八 八 



































这 里 的 错误 消息 已 经 告诉 了 我 们 Rust 是 如 何 处 理 “ 杀 值 闭 包 ” 的 。 这 种 闭 包 从 语言 层面 上 
已 经 被 完全 禁止 了 ,但 负责 清理 工作 的 闭 包 有 时候 也 是 有 用 的 。 为 此 Rust 会 限制 这 种 闭 
包 的 使 用 。 像 f 这 样 清除 值 的 闭 包 不 能 是 Fn。 更 确切 地 说 ， 它 们 根本 就 不 具备 Fn 的 资格 。 
它们 实现 的 是 没有 那么 通用 的 特 型 Fnonce， 这 种 特 型 的 闭 包 只 能 调用 一 次 。 
第 一 次 调用 Fnonce 闭 包 时 ， 闭 包 本 身 也 会 被 用 掉 。 就 像 这 两 个 特 型 Fn 和 Fnonce 是 这 样 定 
义 的 一 样 : 

// 特 型 Fn 和 FnOnce 的 伪 代 码 实现 ， 没 有 参数 


trait Fn() -> R{ 
fn call(&self) -> R; 











} 


trait FnOnce() -> RI{ 
fn call_once(self) -> R; 
} 


跟 a + b 这 样 的 算术 表达 式 实 际 上 是 对 方法 调用 Add::add(a，b) 的 简写 一 样 ，Rust 将 
closure() 作为 对 前 面 展 示 的 两 个 特 型 方法 之 一 的 简写 。 对 于 Fn 闭 包 ，closure() 会 扩展 








为 cLosure() .caLL()， 这 个 方法 以 自身 的 引用 作为 参数 ， 因 此 这 个 闭 包 不 会 被 转移 。 但 如 
果 闭 包 只 能 安全 地 调用 一 次 ， 即 对 于 Fnonce 闭 包 ，closure() 则 会 扩展 为 closure().call_ 
once()。 这 个 方法 会 取得 self 的 值 ， 所 以 闭 包 会 被 用 掉 。 


当然 ， 这 里 是 有 意 使 用 drop() 来 制造 问题 。 实 践 中 ， 多 数 时 候 只 会 偶尔 碰 到 前 面 的 问题 。 
虽然 不 常 出 现 ， 但 有 时 候 也 会 写 出 意外 把 某 个 值 用 掉 的 闭 包 来 : 
let dict = produce_ glossary(); 
let debug dump dict = || { 
for (key, value) in dict { // 哎呀 | 
println!("{:?} - {:?}", key, value); 




















} 
} 


然后 ， 如 有 果 调用 debug_dump_dict() 超过 一 次 ， 就 会 看 到 类 似 下 面 这 样 的 错误 消息 : 


error[E0382]: use of moved value: ‘debug_dump_dict. 
--> CLosures_debug_dump_dict.rs:18:5 





17 debug_dump_dict(); 


| 
| 
| value moved here 
18 | debug_dump_dict(); 
| ^^^^A^A^A^A^AAAAAAA^ value used here after move 
| 


help: closure was moved because it only implements ‘FnOnce. 


为 找到 问题 所 在 ， 必 须知 道 这 个 闭 包 为 什么 是 Fnonce。 这 里 把 哪个 值 用 掉 了 ? 闭 包 里 唯一 
引用 的 不 就 是 dict 吗 ? 啊 ， 发 现 问题 了 : 这 里 直接 迭代 dict 导致 把 它 给 用 掉 了 。 应 该 使 
用 &dict 而 不 是 dict， 即 要 访问 值 的 引用 : 


Let debug dump dict = || { 
for (key, value) in &dict { // 不 会 用 掉 dict 
println!("{:?} - {:?}", key, value); 
} 


}; 
这 样 就 修复 了 问题 。 现 在 这 个 函数 变 成 了 Fn， 调用 多 少 次 都 不 会 出 问题 了 。 


14.4.3 FnMut 
还 有 一 种 闭 包 ， 就 是 包含 可 修改 数据 或 mut 引用 的 闭 包 。 


Rust 认为 非 mut 值 可 以 安全 地 在 线程 间 共 享 。 但 是 ， 如 果 共 享 的 非 mut 闭 包 里 包含 mut 数 
据 同样 是 不 安全 的 。 在 多 个 线程 里 调用 这 个 闭 包 会 导致 各 种 资源 争 用 问题 ， 与 多 个 线程 同 
时 读 写 相同 的 数据 一 样 。 

因此 ，Rust 又 定义 了 一 种 名 为 FnMut 的 闭 包 ， 即 可 以 写 数 据 的 闭 包 。FnMut 闭 包 要 使 用 mut 
引用 来 调用 ， 其 定义 类 似 如 下 这 样 : 


// 特 型 Fn、FnMut 和 FnOnce 的 伪 代 码 实现 
trait Fn() -> RI 
fn call(&self) -> R 


ln 
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} 


trait FnMut() -> RA{ 
fn caLL_mut(&mut self) -> R; 
} 


trait FnOnce() -> RA{ 
fn call_once(self) -> R; 
} 


任何 需要 以 mut 方式 访问 值 但 不 会 清除 任何 值 的 闭 包 都 是 FnMut 闭 包 。 例 如 : 


let mut i = 0; 
Let incr = || { 
i += 1; // 这 里 会 借用 对 i 的 可 修改 引用 
println!("Ding! i is now: {}", i); 
站 
call_twice(incr); 
前 面 定义 的 call_twice 需要 一 个 Fn。 因 为 incr 是 FnMut 而 不 是 Fn， 所 以 上 面 的 代码 会 编 
译 失 败 。 不 过 要 修复 也 很 简单 。 为 理解 修复 的 原理 ， 先 后 退 一 步 ， 回 顾 一 下 Rust 的 这 3 种 
闭 包 。 
。 Fn 是 没有 调用 次 数 限制 的 闭 包 和 函数 ， 是 所 有 fn 函数 中 最 高 的 一 种 。 
。 FnMut 是 如 果 闭 包 本 身 声明 为 mut 也 可 以 多 次 调用 的 闭 包 。 
。 Fnonce 是 如 果 调 用 者 拥有 闭 包 则 只 能 调用 一 次 的 闭 包 。 
每 个 Fn 都 满足 FnMut 的 要 求 ， 每 个 FnMut 都 满足 Fnonce 的 要 求 。 如 图 14-2 所 示 ， 它 们 不 
是 相互 独立 的 。 
































[|drop(v) 


larg| vpush(arg) 


|arglarg+1 
|arg| vcontains(arg) 














图 14-2: 3 种 闭 包 的 维 恩 图 

实际 上 ，Fn() 是 FnMut() 的 子 特 型 ， 而 FnMut() 又 是 Fnonce() 的 子 特 型 。 于 是 Fn 就 成 了 
最 专 一 旦 最 强大 的 类 别 。FnMut 和 Fnonce 则 是 包含 使 用 限制 的 更 广泛 的 类 别 。 

现在 ， 我 们 已 经 了 解 了 这 3 种 闭 包 。 很 显然 ， 要 接收 最 为 广泛 的 闭 包 ，call_twice 函数 应 
该 接收 所 有 FnMut 闭 包 ， 也 就 是 要 修改 为 这 样 : 


fn call_twice<F>(mut closure: F) where F: FnMut() { 
closure(); 
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CLosure(); 


} 


第 一 行 中 的 绑 定 之 前 是 F: Fn()， 而 现在 是 F: FnMut()。 这 样 一 改 ， 仍然 可 以 接收 所 有 Fn 
闭 包 ， 而 且 还 能 对 修改 数据 的 闭 包 调 用 call_twice: 
let mut i = 0; 


call_twice(|| i += 1); // 没 问 题 ! 
assert eq!(i, 2); 


14.5 回调 


很 多 库 提 供 的 API 会 使 用 回调 ， 也 就 是 用 户 提 供 的 函数 ， 供 库 在 以 后 调用 。 事 实 上 ， 本 书 

示例 中 也 出 现 过 这 种 API。 第 2 章 曾 使 用 Icon 框架 编写 过 一 个 简单 的 Web 服务 器 ， 代 码 

类 似 这 样 : 
fn main() { 

let mut router = Router: :new(); 











router .get("/", get form, "root"); 
router .post("/gcd", post gcd, "gcd"); 


println!("Serving on http://localhost:3000..."); 
Iron::new(router).http("localhost:3000").unwrap(); 
} 


这 个 路 由 器 的 用 途 是 将 来 自 互 联网 的 请 求 转发 给 处 理 特定 请 求 的 Rust 代码 。 在 这 个 例子 
中 ，get_form 和 post_gcd 就 是 程序 其 他 地 方 用 fn 关键 字 声 明 的 两 个 函数 名 。 但 其 实 也 可 
以 在 这 里 传 入 闭 包 ， 比 如 : 


Let mut router = Router::new(); 














router.get("/", |_: &mut Request| { 
Ok(get_form_response()) 
}, "root"); 


router .post("/gcd", |request: &mut Request| { 
Let numbers = get_numbers(request)?; 
Ok(get_gcd_response(numbers)) 

}, "gcd"); 


这 是 因为 Fon 的 代码 可 以 接收 任何 线程 安全 的 Fn 作为 参数 。 


如 果 是 自己 的 程序 ， 应 该 怎么 实现 呢 ? 可 以 从 头 开始 写 一 个 非常 简单 的 路 由 器 ， 不 使 用 任 
何 Fon 的 代码 。 先 声明 几 种 类 型 表示 HITP 的 请 求 和 响应 : 


struct Request { 
method: String, 
url: String, 
headers: HashMap<String, String>, 
body: Vec<u8> 
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struct Response { 
code: uy32, 
headers: HashMap<String, String>, 
body: Vec<u8> 

} 


当前 路 由 器 的 任务 就 是 简单 地 保存 一 个 包含 URL 到 回调 的 映射 的 表 ， 以 便 可 以 按 需 
正确 的 回调 。( 简 单 起 见 ， 只 允许 用 户 创建 与 一 个 URL 匹配 的 路 由 。) 


struct BasicRouter<C> where C: Fn(&Request) -> Response { 
routes: HashMap<String, C> 














上 


impl<C> BasicRouter<C> where C: Fn(&Request) -> Response { 


/// 创建 一 个 空 路 由 器 


fn new() -> BasicRouter<C> { 
BasicRouter { routes: HashMap::new() } 


} 


/// 给 路 由 器 添加 一 个 路 由 
fn add_route(&mut self, url: &str, callback: C) { 
self.routes.insert(url.to_string(), callback); 





} 
} 


可 是 ， 有 一 个 地 方 有 错误 。 你 发 现 了 吗 ? 
如 有 果 只 给 这 个 路 由 器 添加 一 个 路 由 是 没有 问题 的 


Let mut router = BasicRouter: :new(); 
router .add_route("/", |_| get_form response()); 


这 可 以 通过 编译 并 和 运行。 不 过 ， 如 果 再 添加 一 个 路 由 : 
router .add_route("/gcd", |req| get_gcd_response(req)); 
就 会 看 到 错误 : 


error[E0308]: mismatched types 
--> Closures_bad_router.rs:41:30 























41 router .add_route("/gcd", |req| get_gcd_response(req)); 


八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 八 


| 
| 
| expected closure, found a different closure 
| 


note: expected type“`[cLosureQcLosures_bad_router .rs:40:27: 40:50] 
found type ‘[closure@closures_ bad_router.rs:41:30: 41:57】] 
note: no two closures, even if identical, have the same type 
help: consider boxing your closure and/or using it as a trait object 


我 们 说 的 错误 就 在 定义 BasicRouter 类 型 上 : 


struct BasicRouter<C> where C: Fn(&Request) -> Response { 
routes: HashMap<String, C> 


调用 





这 里 无 意 之 间 把 BasicRouter 声明 为 了 只 有 一 个 回调 类 型 5，HashMap 中 的 所 有 
个 类 型 。11.1.4 节 展 示 过 一 个 有 同样 问题 的 Salad 类 型 ; 
struct Salad<V: Vegetable> { 
veggies: Vec<V> 
} 





回调 都 是 这 


解决 方案 与 Salad 类 型 一 样 : 因为 想 要 支持 多 种 类 型 ， 所 以 这 里 需要 装 箱 和 特 型 目标 : 


type BoxedCallback = Box<Fn(&Request) -> Response>; 
struct BasicRouter { 


routes: HashMap<String, BoxedCallback> 
} 





每 个 “箱子 ”可 以 包含 不 同类 型 的 闭 包 ， 因 
意 类 型 参数 C 不见 了 。 


这 需要 对 方法 也 做 一 些 调整 : 
impl BasicRouter { 
// 创建 一 个 空 路 上 


日 器 
fn new() -> BasicRouter { 





此 一 个 HashMap 可 以 包含 所 有 类 型 的 回调 。 注 








BasicRouter { routes: HashMap::new() } 
} 


/// 给 路 由 器 添加 一 个 路 由 
fn add_route<C>(&mut self, url: &str, callback: C) 


where C: Fn(&Request) -> Response + 'static 








} 


self.routes.insert(url.to_string(), Box::new(callback)); 
} 


(注意 add_route 中 类 型 签名 c 的 两 个 绑 定 : Fn 特 型 和 'static 生命 期 。Rust 支持 添加 这 个 
'static 绑 定 。 没 有 它 ， 调 用 Box: :new(caLLback) 就 会 


作用 域 的 变量 的 引用 ， 那 么 这 个 调用 就 是 不 安全 的 。) 


最 后 ， 我 们 简单 的 路 由 器 就 可 以 处 理 请 求 了 : 








HH 错 ， 因 为 如 果 闭 包 中 包含 会 超出 


| 








impl BasicRouter { 


fn handle_request(&self, request: &Request) -> Response { 
match self.routes.get(&request.url) { 
None => not_found_response()， 


Some(callback) => callback(request) 
} 


14.6 ”有 效 使 用 闭 包 


如 前 所 见 ，Rust 的 闭 包 与 大 多 数 其 他 语言 中 的 闭 包 不 同 。 最 大 的 区 别 是 在 有 垃圾 回 
言 中 ， 可 以 在 闭 包 中 使 用 局 部 变量 而 无 须 孝 虑 生命 期 或 所 有 权 。 如 有 果 没 有 垃圾 























收 的 语 
回收 ， 情 况 
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就 不 同 了 。Java、C# 和 JavaScript 中 常见 的 设计 模式 无 法 原封 不 动 照搬 到 Rust 里 来 。 


以 图 14-3 所 示 的 MVC (Model-View-Controller， 模 型 -视图 -控制 器 ) 设计 模式 为 例 。 
对 用 户 界 面 上 的 每 个 元 素 ，MVC 框架 都 会 创建 3 个 对 象 : 模型 、 视 图 和 控制 器 ， 其 中 模 
型 表示 UI 元 素 的 状态 ， 视 图 负责 元 素 的 外 观 ， 而 控制 器 处 理 用 户 交 互 。 多 年 来 ， MVC 已 
经 出 现 了 数 不 清 的 变 体 。 但 核心 还 是 3 个 对 象 共同 分 担 UI 的 职责 。 

那么 问题 来 了 。 通 常 ， 每 个 对 象 都 会 有 另 一 个 或 另 两 个 对 象 的 引用 。 可 能 是 直接 引用 ， 也 
如 图 14-3 所 示 。 在 3 个 对 象 中 的 一 个 对 象 发 生 了 某 个 事件 时 ， 它 
会 通知 另外 两 个 对 象 ， 因 此 一 切 会 立即 更 新 。 问 题 在 于 ， 哪 个 对 象 “拥有 ”其 他 对 象 则 永 
远 说 不 清 。 

































































图 14-3: 模型 - 视图 - 控制 器 设计 模式 
这 个 模式 在 未 经 修改 的 情况 下 无 法 在 Rust 中 直接 使 用 。 在 Rust 中 ， 必 须 明 确 所 有 权 ， 必 
须 消除 循环 引用 。 模 型 和 控制 器 不 能 直接 相互 引用 。 


Rust 激进 的 赌注 就 是 一 定 存 在 优秀 的 禁 代 设计 。 有 时 候 ， 可 以 让 每 个 闭 包 接收 它 需 要 的 引 
用 作为 参数 ， 通 过 闭 包 所 有 权 和 生命 期 来 解决 问题 。 有 了 时候， 可 以 在 系统 中 给 每 件 东 西 分 
配 一 个 数值 ， 然 后 传递 数值 而 不 传递 引用 。 或 者 ， 可 以 实现 诸多 MVC 变 体 中 的 一 种 ， 保 
证 对 象 之 间 并 不 是 都 相互 引用 。 再 或 者 ， 可 以 仿效 革 个 非 MVC 系统 ， 比 如 Facebook 的 
Flux 架构 ， 实 现 单 向 数据 流 ， 如 图 14-4 所 示 。 


(from user input) (to display) 


14-4; Flux 架构 是 MVC 的 一 种 替代 架构 

简 言 之 ， 如 果 想 使 用 Rust 闭 包 制造 “对 象 之 海 *， 就 会 碰 到 各 种 问题 。 但 是 任何 问题 都 不 止 一 
种 解决 方案 。 从 这 个 意义 上 说 ， 软 件 工程 这 门 学 科 已 经 转向 了 蔡 代 方案 ， 因 为 它们 更 简单 。 
下 一 章 会 讨论 闭 包 能 够 真正 大 显 身 手 的 主题 。 届 时 ， 我 们 会 利用 Rust 闭 包 的 简洁 、 速 度 和 
高 效 写 出 一 种 不 同 风 格 的 代码 ， 这 种 代码 写 起 来 好 玩 ， 看 起 来 好 懂 ， 而 且 极为 实用 。 
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迭代 妖 





一 直 重 复 的 一 天 终于 结束 了 。 





Phil (电影 《 土 拨 鼠 节 》， 又 译 《 偷 天 情缘 》) 


和 迭代 器 是 一 个 可 以 产生 一 系列 值 的 值 ， 通 常 要 使 用 循环 来 操作 。Rnust 标准 库 提 供 了 遍历 向 
量 、 字 符 串 、 散 列表 和 其 他 集合 的 迭代 器 ， 也 提供 了 从 输入 流 、 网 络 连接 和 线程 间 通 信 深 
道 产生 文本 行 的 迄 代 器 。 当 然 ， 你 也 可 以 实现 自己 的 迭代 器 。Rust 的 for 循环 是 使 用 友 代 
器 最 自然 的 语法 ， 但 达 代 器 本 身 也 提供 了 丰富 的 映射 、 过 滤 、 拼 接 、 收 集 等 方法 。 

Rust 的 达 代 器 非常 灵活 、 擅 长 表达 且 富 有 效率 。 来 看 下 面 的 函数 ， 它 返回 前 n 位 正 整 数 的 
和 (通常 叫 第 个 三 角形 数 ) : 

fn triangle(n: i32) -> i32 { 
let mut sum = 0; 


for i in 1..n+1 { 
Sum += i; 

















SUm 


表达 式 1..n+1 是 一 个 Range<i32> 值 。Range<i32> 是 一 个 迭代 器 ， 可 以 产生 从 起 始 值 ( 包 
含 ) 开始 到 终止 值 (不 含 ) 结束 的 整数 序列 。 因 此 ， 可 以 在 for 循环 中 使 用 它 作 为 操作 数 
来 计算 从 1 到 的 和 。 

不 过 秋 代 器 也 有 一 个 fold 方法 ,该 方法 可 以 用 来 实现 同样 的 逻辑 : 


fn triangle(n: i32) -> i32 { 
(1..n+1).fold(0, |sum, item| sum + item) 




















这 样 累 加 值 会 从 0 开始， 而 fotd 取得 1..n+1 产生 的 每 个 值 ， 把 累加 值 和 这 个 值 传 给 闭 包 
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|sum，item| sum + item。 然 后 闭 包 的 返回 值 又 作为 新 的 累加 值 。 最 后 返回 的 值 就 是 foLd 
自己 返回 的 值 ， 在 这 里 就 是 整个 序列 的 总 和 。 习 惯 了 使 用 for 和 while 循环 可 能 会 觉得 这 
样 有 些 奇 怪 ， 不 过 熟悉 之 后 就 会 发 现 fold 既 清 晰 又 简洁 。 
这 是 标准 的 函数 式 编程 风格 ， 上 共有 表达 性 的 优势 。 不 过 Rust 的 迭代 器 经 过 了 认真 设计 ， 可 
以 确保 编译 器 也 把 它们 编译 为 优化 的 机 器 码 。 对 于 前 面 第 二 版 定义 的 发 布 构建 ，Rust 知道 
fold 的 定义 ， 会 将 其 直接 能 入 triangle 中 。 此 外 ， 闭 包 |sum，item| sum + iten 也 会 腾 入 
其 中 。 最 后 ，Rust 检查 了 组 合 的 代码 ， 发 现 有 计算 从 1 加 到 的 更 简单 方式 ， 和 始终 等 于 
n * (n+1) / 2。Rust 会 把 triangle 的 整个 函数 体 、 循 环 、 闭 包 以 及 所 有 一 切 都 转换 为 一 
条 乘法 指令 和 几 个 算术 操作 。 
这 个 例子 恰好 包含 简单 算术 ， 实 际 上 对 于 更 复杂 的 计算 迭代 器 同样 有 优异 表现 。 这 也 是 
Rust 提供 灵活 抽象 ， 但 没有 或 几乎 没有 开销 的 典型 例证 。 
本 章 剩 下 的 内 容 分 为 5 部 分 。 
。 首先 会 解释 Iterator 和 IntoIterator 特 型 ， 它 们 是 Rust 迭代 器 的 基础 。 
然后 会 看 看 典型 运 代 器 流水 线 的 3 个 阶段 :基于 某 些 来 源 的 值 创建 迭代 器 、 通 过 选择 和 
处 理 值 来 产生 新 运 代 器 ， 以 及 消费 迭代 器 产生 的 值 。 
最 后 会 展示 如 何 实现 自己 的 迭代 器 。 
过 代 器 的 方法 非常 多 ， 因 此 如 果 你 领会 了 中 心思 想 ， 大 可 跳 过 某 一 节 。 不 过 ， 过 代 器 是 写 
出 Rust 特色 代码 的 常用 特性 ， 鹿 悉 迭代 器 提供 的 这 些 工 具 对 掌握 这 门 语言 是 必 不 可 少 的 。 


















































15.1 Iterator 和 IntoIterator 特 型 


过 代 器 指 的 是 任何 实现 std: :iter::Iterator 特 型 的 值 。 


trait Iterator { 
type Item; 
fn next(&mut self) -> Option<Self::Item>; 
… // 许多 默认 方法 
} 
Iten 是 达 代 器 产生 值 的 类 型 。next 方法 要 么 返回 Some(v)， 其 中 v 是 达 代 器 的 下 一 个 值 ， 要 
么 返回 None， 表 示 序 列 终止 。 这 里 省 略 了 选 代 器 的 许多 默认 方法 ， 本 章 后 面 会 详细 介绍 。 


如 果 有 一 种 自然 的 方式 可 以 迭代 某 种 类 型 ， 那 它 可 以 实现 std: :iter::IntoIterator。 它 的 
into_iter 方法 接收 一 个 值 ， 然 后 基于 这 个 值 返 回 一 个 迭代 器 : 
trait IntoIterator Where SeLf: :IntoIter::Item == Self::Item { 
type Item; 
type IntoIter: Iterator; 
fn into iter(self) -> SeLf::IntoIter; 


} 


IntoIter 是 迭代 器 值 本 身 的 类 型 ， 而 Iten 是 它 产生 值 的 类 型 。 我 们 称 任何 实现 IntoIterator 
的 类 型 为 可 迭代 类 型 (iterable)， 因 为 可 以 在 需要 的 时 候 通 过 循环 来 访问 它 。 


Rust 的 for 循环 可 以 顺畅 地 实现 迭代 器 操作 。 要 迁 代 某 个 向 量 的 元 素 ， 可 以 这 样 写 : 
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println!("There's:"); 
Let v = vec!["antimony", "arsenic", "aluminuyum", "selenium"]; 


for element in &v { 
println!("{}", element); 





而 在 后 台 ， 每 个 for 循环 都 只 是 对 调用 IntoIterator 和 Iterator 方法 的 简写 形式 : 


Let mut iterator = (&v).into iter(); 
while let Some(element) = iterator.next() { 
println!("{}", element); 


这 也 就 是 说 ，for 循环 会 使 用 IntoIterator: :into_iter 将 其 操作 数 &v 转换 为 一 个 迭代 器 ， 
然后 重复 调用 Iterator: :next。 每 次 返回 Some(eLement)，for 循环 都 执行 其 循环 体 。 而 如 
果 返 回 的 是 None， 则 结束 循环 。 


虽然 for 循环 始终 会 对 其 操作 数 调 用 into_iter， 但 也 可 以 直接 把 迭代 器 传 给 for 循环 。 前 
看 例子 中 循环 访问 Range 时 就 是 这 样 做 的 。 所 有 迭代 器 都 自动 实现 IntoIterator， 因 而 有 
一 个 into_iter 方法 返回 这 个 迭代 器 。 
如 果 在 过 代 器 返回 None 之 后 再 次 调用 它 的 next 方法 ，Iterator 特 型 则 并 没有 规定 这 时 候 
该 怎么 做 。 大 多 数 迭 代 器 会 再 次 返回 None， 但 不 是 全 部 。( 如 果 你 因此 碰 到 了 问题 ，15.3.7 
节 的 fuse 适配器 可 能 会 有 用 。) 
下 面 简单 总 结 一 下 友 代 器 相关 的 术语 。 
如 前 所 述 ， 和 迭代 器 (iterator) 指 的 是 任何 实现 Iterator 的 类 型 。 
可 和 迭代 类 型 (iterable) 指 的 是 实现 IntoIterator 的 类 型 : 调用 它 的 into_iter 方法 可 以 
取得 它 的 从 代 器 。 因 此 前 面向 量 的 引用 &v 就 是 一 个 可 迭代 类 型 。 
迭代 器 产生 值 。 
迭代 器 产生 的 值 叫 迭代 项 (item) ,在 前 面 的 例子 中 ,"antimony"、"arsenic" 等 都 是 迭代 项 。 
接收 迭代 器 产生 的 迭代 项 的 代码 叫 消费 者 (consumer)。 前 面 例子 中 的 for 循环 消费 了 
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过 代 器 的 迄 代 项 。 
15.2 创建 迭代 器 
Rust 标准 库 文档 详细 解释 了 每 个 类 型 提供 了 什么 样 的 迭代 器 ， 但 文档 遵循 茶 种 通用 形式 .以 














便 读者 理 清 头绪 ， 找 到 想 找 的 内 容 。 





15.2.1 iter 和 iter_mut 方 法 
大 多 数 集合 类 型 提供 了 iter 和 iter_mut 方法 ， 返 回 该 类 型 的 迭代 器 ， 产 生 每 个 进 代 项 的 
共享 或 可 修改 引用 。 切 片 类 型 8[T] 和 &str 也 有 iter 和 iter_mut 方法 。 如 果 不 想 使 用 for 
循环 ， 那 么 这 两 个 方法 就 是 取得 迭代 器 最 常用 的 方式 ， 

Let v = vec![4，20，12，8，6]; 

let mut iterator = v.iter(); 
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assert_ eq!(iterator.next(), Some(&4)); 
assert_ eq!(iterator.next(), Some(&20)); 
assert eq!(iterator.next(), Some(&12)); 
assert_ eq!(iterator.next(), Some(&8)); 
assert eq!(iterator.next(), Some(&6)); 
assert_ eq!(iterator.next(), None); 


这 个 迭代 器 的 迭代 项 类 型 是 &i32， 
达 向 量 的 末尾 。 





每 次 调用 next 都 会 产生 对 下 一 个 元 素 的 引用 ， 直 到 到 


每 个 类 型 都 可 以 实现 iter 和 iter_mut， 什 么 实现 方式 合适 自己 决定 。std::path: :Path 的 


iter 方法 返回 的 迭代 器 每 次 会 产生 路 径 的 一 个 组 件 : 


这 个 迭代 器 的 友 代 项 类 型 是 &std: :ffi: 
串 切 片 。 





use std::ffi::0sStr; 
use std::path::Path; 


Let path = Path::new("C:/Users/JimB/Downloads/Fedora.iso"); 
let mut iterator = path.iter(); 

assert eq!(iterator.next(), Some(OsStr::new("C:"))); 

assert eq!(iterator.next(), Some(OsStr::new("Users"))); 
assert eq!(iterator.next(), Some(OsStr::new("JimB"))); 


15.2.2 IntoIterator 实 现 


如 果 类 型 实现 了 IntoIterator， 


// 一 般 会 使 用 HashSet， 但 它 的 迭代 顺序 不 确定 。 为 保证 顺序 ， 

// 因此 这 个 例子 使 用 了 BTreeSet 

use std::collections::BTreeSet; 

Let mut favorites = BTreeSet: :new(); 

favorites.insert("Lucy in the Sky With Diamonds".to_string()); 
favorites.insert("Liebestriume No. 3".to_string()); 





Let mut it = favorites.into iter(); 

assert eql!(it.next(), Some("Liebestrijume No. 3".to_string())); 

assert eq!(it.next(), Some("Lucy in the Sky With Diamonds".to_string())); 
assert eq!(it.next(), None); 


:0sSstr， 是 操作 系统 调用 可 以 接受 的 、 借 用 的 字符 


则 可 以 调用 它 的 into_iter 方法 ， 跟 for 循环 一 样 : 


实际 上 大 多 数 集合 提供 了 不 止 一 个 IntoIterator 的 实现 ， 分 别 用 于 共享 引用 、 可 修改 引用 
和 转移 。 








于 集合 的 可 修改 引用 ，into_iter 会 返回 产生 迭代 项 可 修改 引用 的 友 代 器 。 
vector 是 某 种 vec<String>， 那 么 调用 (&mut vector) .into_iter() 会 返回 
型 是 &mut String 的 运 代 器 。 

于 按 值 传递 的 集合 ,into_iter 返回 的 迭代 器 会 取得 集合 的 所 有 权 , 并 按 值 返回 








hb 





对 于 集合 的 共享 引用 ，into_iter 会 到 同 产 生 选 代 项 共 剖 引用 的 欠 代 器 。 例如 ， 在 前 面 
的 代码 中 ，(&favorites) .into_iter() 会 返回 一 个 Item 类 型 是 &String 的 友 代 器 


外 订 。 
例如 ， 如 


一 个 Item 





迭代 项 。 


此 时 , 迭代 项 的 所 有 权 从 集合 转移 到 消费 者 , 原始 集合 在 这 个 过 程 中 会 被 消费 掉 。 例 如 ， 
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前 面 例子 中 调用 favorites.into_iter() 返回 的 返 代 器 会 按 值 产 生 每 个 字符 串 ， 消 费 者 
会 取得 每 个 字符 串 的 值 。 当 迭代 器 被 清除 后 ，BTreeset 中 剩余 的 元 素 也 会 被 清除 ， 而 集 
合 所 剩 的 空 克也 会 被 处 理 掉 。 
因为 for 循环 会 对 其 操作 数 应 用 IntoIterator: :into_iter， 所 以 这 3 个 实现 就 可 以 支持 迭 
代 集 合 的 共享 引用 或 可 修改 引用 ， 以 及 消费 集合 并 取得 其 元 素 所 有 权 : 
for element in &collection { ... } 


for element in &mut collection { ... } 
for element in collection { ... } 


每 种 用 法 都 会 对 应 调用 上 面 的 一 种 IntoIterator 实现 。 

并 不 是 所 有 类 型 都 会 提供 全 部 3 种 实现 。 例 如 ，HashSset、BTreeSet 和 BinaryHeap 就 
没有 对 可 修改 引用 实现 IntoIterator， 因 为 修改 它们 的 元 素 可 能 违背 类 型 的 不 变性 ， 
比如 被 修改 的 值 变 成 不 同 的 散 列 值 或 者 相对 周边 元 素 做 了 不 同 排序 ， 导 致 修改 后 把 元 
素 放 到 错误 的 位 置 上 。 其 他 类 型 确实 有 支持 可 修改 引用 的 ， 但 只 是 部 分 支持 。 例 如 ， 
HashMap 和 BTreeMap 会 产生 它们 值 的 可 修改 引用 ， 但 只 产后 它们 键 的 共享 引用 ， 原 因 
与 前 面 所 讲 类 似 。 

一 般 原 则 是 迭代 应 该 高 效 和 可 预测 ， 因 此 相 比 于 提供 耗 时 或 可 能 导致 意外 行为 (例如 ， 重 
新 计算 Hashset 元 素 的 散 列 之 后 又 会 重新 访问 它们 ) 的 实现 ，Rust 选择 完全 名 略 它们 。 
切片 实现 了 3 种 IntoIterator 变 体 中 的 两 个 ， 因 为 它 本 身 没 有 元 素 的 所 有 权 ， 所 以 就 没有 
“ 按 值 ” 这 种 情况 。 而 &[T] 和 &mut [T] 的 into_iter 返回 的 迭 代 器 ， 可 以 产生 对 它们 元 素 
的 共享 引用 和 可 修改 引用 。 如 果 把 底层 切片 类 型 [T] 想象 为 某 种 类 型 的 集合 ， 就 能 从 整体 
上 理解 这 种 实现 了 。 
有 人 可 能 注意 到 了 ， 对 于 前 两 个 IntoIterator 变 体 ， 即 共享 引用 和 可 修改 引用 ， 等 价 于 在 
引用 值 上 调用 iter 或 iter_mut。Rust 为 什么 两 个 都 提供 呢 ? 

IntoIterator 是 for 循环 底层 的 基础 ， 因 此 显然 是 必要 的 。 但 在 不 使 用 for 循环 时 ， 
favorites.iter() 要 比 (&favorites).into_iter() 清晰 得 多 。 按 共享 引用 友 代 是 很 常见 的 ， 
所 以 iter 和 iter_mut 更 符合 人 的 常识 。 

IntoIterator 在 泛 型 代码 中 也 可 以 派 上 用 场 。 比 如 ， 可 以 通过 T: IntoIterator 绑 定 来 限 
制 类 型 变量 T 为 可 迭代 的 类 型 。 或 者 ， 可 以 通过 T: IntoIterator<Item=U> 进一步 要 求 迭 代 
产生 指定 的 类 型 U。 例 如 ， 下 面 这 个 函数 可 以 接收 任何 可 迭代 类 型 ， 将 它们 通过 "{:?}" 格 
式 打印 的 值 打印 出 来 : 


use std: :fmt::Debug; 
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fn dump<T, U>(t: T) 
where T: IntoIterator<Item=U>， 
U: Debug 
{ 
foruintf{ 
println!("{:?}", u); 
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不 能 使 用 iter 和 iter_mut 来 实现 这 个 泛 型 国 数 ， 因 为 它们 不 是 任何 特 型 的 方法 。 大 多 数 
可 迭代 类 型 只 是 恰好 有 以 这 两 个 名 字 命 名 的 方法 而 已 。 





15.2.3 drain 方法 


很 多 集合 类 型 会 提供 drain 方法 ， 以 一 个 集合 的 可 修改 引用 为 参数 ， 返 回 一 个 能 把 每 个 元 
素 所 有 权 传 给 消费 者 的 迭代 器 。 不 过 ， 与 按 值 接收 并 消费 集合 的 into_iter() 方法 不 同 ， 
drain 只 是 借用 对 集合 的 引用 ， 在 迭代 器 被 清除 后 ， 它 会 清空 集合 中 所 有 剩余 的 元 素 。 

在 可 以 通过 范围 指定 索引 的 类 型 如 String、 向 量 和 VecDeque 中 ，drain 方法 接收 要 移 除 元 
素 的 范围 ， 而 不 是 排 取 (drain) 整个 序列 : 


use std::iter::FromIterator; 

















let mut outer = "Earth".to_string(); 
let inner = String::from iter(outer.drain(1..4)); 


assert_eq!(outer, "Eh"); 
assert_ eq!(inner, "art"); 


如 果 确 实 需要 排 取 整 个 序列 ， 那 么 可 以 使 用 全 范围 (..) 作为 参数 。 


15.2.4 ”其 他 迭代 器 源 


上 一 节 主 要 介绍 了 向 量 和 HashMap 这 样 的 集合 类 型 。 实 际 上 ， 标 准 库 中 还 有 很 多 其 他 类 型 
支持 迭代 。 表 15-1 总 结 了 其 中 比较 有 意思 的 ， 但 并 不 止 这 些 。 第 16 章 、 第 17 章 和 第 18 
章 在 介绍 特定 类 型 时 会 详细 介绍 其 他 方法 。 


表 15-1: 标准 库 中 的 其 他 迭代 器 













































































类 型 或 特 型 表达 贡 说 明 
std: :ops: :Range 1..10 端点 必须 是 可 以 迭代 的 整数 类 型 。 范 围 包 
含 起 始 值 ， 不 包含 终止 值 
std: :ops: :RangeFrom 1,, 无 限定 迭代 。 起 始 值 必须 是 整数 。 如 果 值 
超过 类 型 限制 可 能 会 证 异 或 溢出 
Option<T> Some(10).iter() 类 似 长 度 为 0 (None) 或 1 (Some(v)) 的 
向 量 
ResuLt<T，E> Ok("blah").iter() 类 似 Option， 产 生 ok 值 
Vec<T>, &[T] v.windows(16) 从 左 到 右 产生 给 定 长 度 的 每 个 连续 切片 。 
窗口 重 倒 
v.chunks(16) 从 左 到 右 产生 给 定 长 度 的 非 重 登 连续 切片 
v.chunks_mut(1024) 类 似 chunks， 但 切片 是 可 修改 的 
v.split(|byte| byte & 1 != 9) 产生 以 匹配 给 定 断 言 的 元 素 分 割 的 切片 
Vv.split mut(...) 同上 ， 但 产生 可 修改 切片 
v.rsplit(...) 类 似 sptit， 但 从 右 到 左 产生 切片 
v.splitn(n, ...) 类 似 sptit， 但 最 多 产生 nn 个 切片 














类 型 或 特 型 表 达 式 说 明 
String, &str s.bytes() 产生 UTF-8 形式 的 字 节 
s.chars() 产生 UTF-8 表示 的 字符 


std: :collections: 


std: 


:HashMap, 


:collections::BTreeMap 


:HashSset， 
:BTreeSet 


std: :collections: 


std: :collections: 


std: :sync: :mpsc: :Receiver 
std: :io: :Read 


std: :io: :BufRead 


std: :fs: :ReadDir 


std: :net::TcpListener 


Free functions 


15.3 


wm 


.Split whitespace() 


a 


.Lines() 


SpLLE("/) 


W 


s.matches(char::is_numeric) 
map.keys() ， 

map.values() 
map.values_mut() 


set1.union(set2) 


set1.intersection(set2) 
recv.iter() 
stream.bytes() 
stream.chars() 
bufstream.lines() 


bufstream.split(0) 


std::fs::read_dir(path) 
listener .incoming() 
std::iter::empty() 
std::iter::once(5) 


std::iter::repeat("#9") 


达 代 器 适配器 


以 空格 分 割 字 符 串 ， 产 生 非 空格 字符 的 切片 








产生 字符 串 行 的 切片 
以 给 定 模式 分 割 字符 囊 ， 产 生 





匹配 之 间 内 





容 的 切片 。 模 式 可 以 是 字符 、 字 符 串 、 闭 


包 等 
产生 匹配 给 定 模式 的 切片 
产生 对 映射 键 或 值 的 共享 引用 








产生 对 条 目 值 的 可 修改 引用 


产生 对 set1 与 set2 合集 元 素 的 共享 引用 








产生 对 set1 与 set2 交集 元 素 的 共享 引用 











产生 另 一 个 线程 中 对 应 Sender 发 送 的 值 





从 LO 流产 生字 市 





将 流 作为 UTF-8 解析 并 产生 字符 














将 流 作为 UTF-8 





坚 析 并 产生 String 行 


以 给 定 字 节 分 割 流 ， 产 生 该 字 节 间 的 


Vec<u8> 缓冲 
产生 目录 项 
产生 到 来 的 网 络 连 接 
立即 返回 None 
产生 给 定 的 值 ， 然 后 结束 
一 直 产 生 给 定 的 值 























一 旦 有 了 迭代 器 ，Iterator 特 型 就 会 提供 大 量 可 供 选择 的 适配器 方法 ， 或 简称 适配器 


(adapter) 。 这 些 适 配器 消费 一 个 迭代 器 并 创建 一 个 具 





颖 ， 接 下 来 会 介绍 其 中 两 个 最 流行 的 。 


15.3.1 


map 和 fiLLter 





备 有 用 行为 的 新 迭代 器 。 














为 了 解 适 配 


Iterator 特 型 的 map 适配器 可 以 为 迭代 器 的 每 个 迭代 项 都 应 用 一 个 闭 包 ， 而 fiLter 适配器 
可 以 通过 和 迭 代 器 来 过 滤 某 些 从 代 项 ， 使 用 闭 包 来 决定 保留 哪个 、 清 除 哪 个 。 


例如 ， 假 设 我 们 在 迭代 文本 行 时 想 忽 略 每 一 行 开 头 和 末尾 的 空格 。 标 准 库 的 str: :trin 方 


法 会 清除 &str 开头 和 末尾 的 空格 ， 返 





适配器 给 进 代 器 中 的 每 一 行 应 用 str: :trinm: 


回 一 个 新 的 修整 后 的 借用 原始 值 &str。 可 以 通过 map 
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Let text = " ponies \n giraffes\niguanas \nsquid".to_string(); 
let v: Vec<&str> = text.lines() 

.map(str::trim) 

.Collect(); 
assert eq!(v, ["ponies", "giraffes", "iguanas", "squid"]); 


text.lines() 调用 返回 的 是 产生 字符 串 行 的 迭代 器 。 在 这 个 从 代 器 上 调用 map 会 返回 另 一 
个 迭代 器 ， 它 的 每 一 项 是 对 每 一 行 应 用 str: :trin 之 后 的 结果 。 最 后 ，collect 将 所 有 项 收 
集 到 一 个 向 量 里 。 


当然 ， 调 用 map 返回 的 迭代 器 本 身 仍 然 可 以 继续 使 用 适配器 。 对 于 前 面 的 例子 ， 如 果 还 想 
在 结果 中 排除 美洲 晰 蝎 ("tguanas") ， 可 以 这 样 写 : 
let text = " ponies \n giraffes\niguanas \nsquid".to_string(); 
let v: Vec<&str> = text.Lines() 
.map(str::trim) 
.filter(|s| *s != "iguanas") 
.collect(); 
assert eq!(v, ["ponies", "giraffes", "squid"]); 


这 里 ， 调 用 filter 会 返回 第 三 个 迭代 器 ， 只 产生 map 迭代 器 结果 中 对 闭 包 |s| *s != 
"iguanas" 返回 true 的 那些 项 。 这 样 一 个 迭代 器 适配器 的 连 级 调用 ， 就 像 Unix 中 的 管道 
操作 。 每 个 适配器 都 有 自己 独立 的 职责 ， 从 左 到 右 可 以 清楚 地 知道 每 次 转换 都 做 了 什么 。 
map 和 filter 适配器 的 签名 如 下 : 


fn map<B, F>(self, f: F) -> some Iterator<Item=B> 
where Self: Sized, F: FnMut(Self::Item) -> B; 






































fn filter<P>(self, predicate: P) -> some Iterator<Item=Self::Item> 
where Self: Sized, P: FnMut(&Self::Item) -> bool; 


这 里 用 作 返 回 值 类 型 的 some Iterator<...> 并 不 是 有 效 的 Rust 语法”。 真 正 的 返回 值 类 型 
是 不 透明 的 struct 类 型 ， 但 表达 性 差 ， 关键 是 实践 中 这 些 方法 会 返回 给 定 Item 类 型 的 达 
代 妖 。 

因为 大 多 数 适配器 按 值 取得 self， 所 以 它们 要 求 Self 是 Sized (所 有 常用 迭代 器 都 是 )。 


map 迭代 器 将 每 一 项 按 值 传 给 其 闭 包 ， 进 而 将 团 包 返回 结果 的 所 有 权 传 给 消费 者 。filter 
迭代 器 将 每 一 项 的 共享 引用 传 给 其 闲 包 ， 在 将 选中 项 传 给 其 消费 者 时 ， 保 留 该 项 的 所 有 
权 。 这 也 正 是 代码 中 会 解 引 用 s 再 将 其 与 "iguanas" 比较 的 原因 。filter 友人 代 器 的 项 类 型 
是 &str， 因 此 闭 包 参数 s 的 类 型 是 &&str。 


关于 迭代 器 适配器 ， 有 两 个 要 点 需要 明确 。 


首先 ， 简 单 地 在 一 个 迭代 器 上 调用 适配器 不 会 消费 任何 项 ， 只 会 返回 一 个 新 运 代 器 ， 并 可 
以 按 需 从 第 一 个 迭代 器 排 取 以 产生 自己 的 项 。 在 适配器 链 中 ， 唯 一 可 以 真正 让 操作 落地 的 
是 在 最 终 的 迭代 器 上 调用 next。 






































注 1: Rust RFC 1522 会 添加 与 这 里 的 some Iterator 表示 法 非常 类 似 的 语法 。Rust 1.17 还 没有 默认 包含 这 
个 语法 。 








因此 在 前 面 的 例子 中 ， 方 法 调用 text.lines() 本 身 不 会 真正 从 字符 串 中 解析 出 任何 行 ， 而 只 会 
返回 一 个 迭代 器 ， 将 来 再 根据 需要 解析 行 。 类 似 地 ，map 和 人 filter 也 会 返回 新 迭代 器 ， 将 来 再 
根据 需要 映射 和 过 滤 。 在 cotlect 调用 filter 友 代 器 的 next 之 前 ， 不 会 发 生 真正 的 操作 。 


里 解 这 一 点 对 使 用 具有 副作用 的 适配器 特别 重要 。 例 如 ， 下 面 的 代码 什么 也 不 会 打印 : 
["earth", "water", "air", "fire"] 
.iter().map(l|elt| println!("{}", elt)); 
iter 调用 返回 基于 数组 元 素 的 迭代 器 ， 而 map 调用 返回 对 第 一 个 迭代 器 产生 的 每 个 值 应 用 
闭 包 的 第 二 个 迭代 器 。 但 调用 链 中 并 没有 真正 请 求 处 理 某 个 值 的 代码 ， 因 此 也 不 会 调用 任 
何 碗 代 器 的 next 方法 。 事实 上 ，Rust 对 此 会 给 出 警告 : 
warning: unused resuLt which must be used: 


iterator adaptors are lazy and do nothing unless consumed 
| 

387 | / ["earth", "water", "air", "fire"] 

388 | | .iter().map(|elt| println!("{}", elt)); 
人 
| 


= note: #[warn(unused_must_use)] on by default 


络 误 消息 中 的 “lazy”( 懒 ) 在 这 里 并 不 是 一 个 贬义 词 ， 而 是 一 个 专用 概念 ， 指 的 是 一 种 将 
计算 推迟 到 真正 需要 时 的 机 制 。Rust 的 约定 是 迭代 器 在 满足 每 个 next 调用 前 应 该 尽量 什 
么 都 不 做 。 在 这 个 例子 中 ， 根 本 就 没有 调用 next， 所 以 什么 也 不 会 发 生 。 


第 二 个 要 点 是 迭代 器 适配器 属于 零 开 销 抽象 。 因 为 map、filter 及 其 同类 方法 是 泛 型 的 ， 
所 以 把 它们 应 用 给 迭代 器 会 针对 涉及 的 特定 迭代 器 类 型 特 化 它们 的 代码 。 这 意味 着 Rust 有 
足够 的 信息 把 每 个 迭代 器 的 next 方法 行内 化 到 其 消费 者 中 ， 然 后 将 整套 代码 作为 一 个 单位 
翻译 为 机 器 码 。 因 此 前 面 所 示 迭 代 器 的 Lines/map/filter 调用 链 ， 实 际 上 与 手写 的 如 下 代 
码 同样 高 效 : 
for Line in text.lines() { 
Let Line = line.trim(); 


if line != "iguanas" { 
v.push(line); 


Ba 











































































































} 
本 市 剩 下 的 部 分 介绍 Iterator 特 型 支持 的 各 种 适配器 。 


15.3.2 filter_map 和 flat_map 

map 适配器 适合 一 个 进项 对 应 一 个 出 项 的 场景 。 有 时 候 ， 可 能 需要 在 迭代 中 清除 某 些 项 ， 
或 者 用 零 或 多 项 奉 代 一 项 。 此 时 filter_map 和 flat_map 适配器 可 以 满足 需求 。 
filter_nap 适配器 与 map 类 似 ， 只 是 它 允 许 闭 包 在 选 代 过 程 中 要 么 转换 项 ( 像 map 那样 )， 
要 么 删除 项 。 总 之 就 类 似 filter 和 map 的 组 合 。 它 的 签名 如 下 ， 


fn filter_map<B, F>(self, f: F) -> some Iterator<Item=B> 
where Self: Sized, F: FnMut(SeLf: :Item) -> Option<B>; 
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跟 map 的 签名 一 样 ， 只 是 这 里 闭 包 返回 的 是 0ption<B>， 而 不 是 B。 如 果 闭 包 返 回 None， 就 
表示 从 迭代 中 清除 项 ， 如 果 返 回 Some(b)， 则 b 就 是 fiLter_map 迭代 器 产生 的 下 一 项 。 


例如 我 们 想 处 理 一 个 空格 分 隔 的 字符 串 ， 从 中 解析 出 数值 ， 然 后 处 理 数 值 ， 清 除 其 他 非 数 
值 。 可 以 这 样 写 : 


use std::str::FromStr; 











Let text = "1i\nfrond .25 289\n3.1415 estuary\n"; 
for number in text.split whitespace() 
.filter_map(|w| f64::from str(w).ok()) { 
println!("{:4.2}", number.sqrt()); 





这 样 会 打印 出 如 下 结果 : 


1.00 
0.50 
17.00 
1.77 


提供 给 filter_map 的 闭 包 尝 试 使 用 f64: :from_str 解析 每 个 空格 分 隔 的 切片 ， 返 回 Result<f64， 
ParseFLoatError>， 然 后 .ok() 把 它 转换 为 0ption<f64>: 解析 错误 变 成 了 None， 而 成 功 解析 
出 的 结果 变 成 了 Some(v)。fitLter_map 迭代 器 清除 所 有 None 值 ， 产 生 每 个 Some(v) 的 值 v。 


把 map 和 filter 像 这 样 融合 为 一 个 调用 〈 而 不 是 分 别 调用 它们 ) 的 目的 何在 ? filter_map 
适配器 的 价值 在 刚才 那个 例子 里 已 经 展示 得 很 充分 了 。 它 表明 : 在 迭代 中 决定 是 否 包含 某 一 
项 的 最 好 方式 ， 就 是 尝试 实际 去 处 理 它 。 直 接 使 用 filter 和 map 当然 可 以 ， 就 是 显得 有 点 
策 了 : 结果 变 成 了 Some(v)。filter_map 迭代 器 清除 所 有 None 值 ， 产 生 每 个 Some(v) 的 值 v。 


把 map 和 filter 像 这 样 融 合 为 一 个 调用 (而 不 是 分 别 调用 它们 ) 的 目的 何在 ? fitter_map 适 
配器 的 价值 在 刚才 那个 例子 里 已 经 展示 得 很 充分 了 。 它 表明 : 在 友 代 中 决定 是 否 包 含 某 一 项 的 
最 好 方式 ， 就 是 尝试 实际 去 处 理 它 。 直 接 使 用 filter 和 map 当然 可 以 ， 就 是 显得 有 点 箱 了 : 
text.split_ whitespace() 
.map(|w| f64::from_str(w)) 


.filter(|r| r.is_ok()) 
.map(|r| r.unwrap()) 














可 以 把 flat_map 适配器 看 成 map 加 fiLter_map， 只 不 过 现在 闭 包 不 只 是 会 返回 一 项 ( 像 
map 那样 ) 或 返回 零 或 多 项 〈 像 fitter 那样 ) ， 而 是 会 返回 任意 多 个 项 的 序列 。flLat_map 
友 代 器 产生 闭 包 返 回 序列 的 拼接 结果 。 
flat_map 的 签名 如 下 所 示 : 


fn flat_map<U, F>(self, f: F) -> some Iterator<Item=U: :Item> 
where F: FnMut(Self::Item) -> U, U: IntoIterator; 


传 给 flat_map 的 闲 包 必 须 返 回 一 个 可 迭代 类 型 ， 任 何 可 迭代 类 型 都 可 以 。” 



































注 2: 实际 上 ， 因 为 可 以 把 0ption 看 成 包含 一 系列 零 或 一 项 的 可 进 代 类 型 ， 所 以 iterator.filter_map(closure) 
和 iterator.fLat_map(cLosure) 在 cLosure 返回 0ption 时 是 等 价 的 。 























例如 ， 假 设 有 一 个 表 ， 其 映射 的 是 国家 与 它们 的 主要 城市 。 给 定 一 组 国家 ， 怎 么 遍历 它们 
的 主要 城市 ? 


use std::collections::HashMap; 





let mut major_cities = HashMap: :new(); 

major_cities.insert("Japan", vec!["Tokyo", "Kyoto"]); 
major_cities.insert("The United States", vec!["Portland", "Nashville"]); 
major_cities.insert("Brazil", vec!["Sao Paulo", "Brasilia"]); 
major_cities.insert("Kenya", vec!["Nairobi", "Mombasa"]); 
major_cities.insert("The Netherlands", vec!["Amsterdam", "Utrecht"]); 


Let countries = ["Japan", "Brazil", "Kenya"]; 


for &city in countries.iter().flat map(|country| &major_cities[country]) { 
println!("{}", city); 


这 样 会 打印 出 如 下 结果 : 


Tokyo 
Kyoto 

Sao Paulo 
Brasilia 
Nairobi 
Mombasa 


对 此 ， 一 种 理解 方式 是 对 每 个 国家 ， 先 取得 其 城市 的 向 量 ， 然 后 把 所 有 向 量 拼接 为 一 个 序 
列 ， 再 把 它 打印 出 来 。 


但 别 筷 了 迭代 器 很 懒惰 ， 只 有 for 循环 调用 flat_map 迭代 器 的 next 方法 时 才 会 实际 发 生 
操作 。 拼 接 完 整 序列 的 操作 不 会 在 内 存 中 发 生 。 相 反 ， 这 里 会 有 一 个 小 状态 机 ， 从 城市 迭 
代 器 中 取 值 ， 每 次 取 一 个 ， 直 到 取 完 为 目 。 此 时 ， 才 会 产生 下 一 个 国家 的 新 城市 迭代 器 。 
效果 就 类 似 一 个 藤 套 循环 ， 只 是 被 装配 成 了 迭代 器 来 使 用 。 


























15.3.3 scan 


scan 适配器 类 似 于 map， 区 别 在 于 它 会 传 给 闭 包 一 个 可 修改 的 值 ， 而 且 可 以 选择 提前 终止 
和 代 。 它 接收 一 个 初始 状态 值 和 一 个 困 包 ， 团 包 又 接收 一 个 对 这 个 状态 的 可 修改 引用 和 底 
层 迭 代 器 的 下 一 项 。 这 个 闭 包 必须 返回 0ption，scan 友 代 器 将 其 作为 自己 的 下 一 项 。 


例如 ， 下 面 这 个 和 迭代 器 链 会 对 另 一 个 迭代 器 的 项 求 平方 ， 并 在 和 超过 10 时 终止 选 代 。 


Let iter = (0..10) 
.SCan(0，|sum，item| { 
*sUm += item; 
if *sum > 10 { 























None 
} elsef 
Some(item * item) 
} 
}); 
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assert eq!(iter.collect::<Vec<i32>>(), vec![0, 1, 4, 9, 16]); 


闭 包 的 sum 参数 是 一 个 迭代 器 私有 变量 的 可 修改 引用 ， 在 scan 的 第 一 个 参数 中 初始 化 ， 这 
里 就 是 0。 闭 包 会 更 新 *sum， 检 查 它 是 否 超出 了 限制 ， 然 后 返回 迭代 器 的 下 一 个 结果 。 























15.3.4 take 和 和 take_while 


Iterator 特 型 的 take 和 take_while 适配器 用 于 在 取得 一 定 项 数 之 后 或 闭 包 决 定 中 断 时 终 
止 选 代 。 它 们 的 签名 如 下 所 示 : 


fn take(self, n: usize) -> Some Iterator<Item=SeLf: :Item> 
where Self: Sized; 


fn take while<Pp>(self, predicate: P) -> some Iterator<Item=Self::Item> 
where Self: Sized, P: FnMut(&Self::Item) -> bool; 











这 两 个 适配器 都 会 取得 一 个 迭代 器 的 所 有 权 ， 返 回 一 个 新 迭代 器 ， 这 个 新 运 代 器 会 从 第 
一 项 开始 产生 值 ， 但 可 能 提前 终止 序列 。take 迭代 器 在 产生 最 多 nn 项 后 返回 None。 是 
while 迭代 器 对 每 一 项 应 用 predicate， 在 遇 到 第 一 个 predicate 返回 false 的 项 时 返 


None， 后 续 每 次 调用 next 也 都 返回 None。 
例如 ， 有 一 封 邮件 ， 其 以 空 行 分 隔 标 题 行 和 正文 。 可 以 使 用 take_while 只 迭代 标题 行 : 


Let message = "To: jimb\r\n\ 
From: superego <editor@oreilly.com>\r\n\ 
\rin\ 
Did you get any writing done today?\r\n\ 
When will you stop wasting time plotting fractals?\r\n"; 
for header in message.lines().take while(|l| !l.is empty()) { 
println!("{}" , header); 




















3.5.1 节 介 绍 过 ， 当 一 行 字符 串 以 斜 杠 结尾 时 ，Rust 不 会 在 字符 串 中 包含 下 一 行 的 缩 进 ， 
此 字符 串 中 每 一 行 前 面 都 不 会 有 空格 。 这 意味 着 message 的 第 三 行 是 空 的 。take_while 适 
配器 一 磁 到 这 个 空 行 就 会 终止 迄 代 ， 因 此 以 上 代码 只 会 打印 出 下 面 两 行 

To: jimb 

From: Superego <editor@oreilly.com> 











15.3.5 skip 和 和 skip_while 


Iterator 特 型 的 skip 和 skip_while 方法 是 对 take 和 take_while 的 补充 ， 它 们 从 达 代 开始 
清除 一 定数 量 的 项 ， 或 者 一 直 清 除 到 闭 包 发 现 一 个 可 以 接受 的 项 ， 然 后 将 剩余 项 原封 不 动 
返回 。 它 们 的 签名 如 下 : 


fn skip(seLf，n: usize) -> Some Iterator<Item=SeLf: :Item> 
where Self: Sized; 








fn skip while<Pp>(self, predicate: P) -> some Iterator<Item=Self::Item> 
where Self: Sized, P: FnMut(&Self::Item) -> bool; 





skip 适配器 的 一 个 常用 场景 是 在 迭代 程序 的 命令 行 参数 时 跳 过 命令 名 。 第 2 章 的 最 大 公约 
数 计算 器 中 使 用 了 以 下 代码 遍历 其 命令 行 参 数 : 


for arg in std::env::args().skip(1) { 

















} 


std: :env::args 国 数 返 回 一 个 迭代 器 ， 该 迭代 器 会 产生 String 类 型 的 程序 参数 ， 其 中 第 
一 项 是 程序 本 身 的 名 字 。 程 序 的 名 字 并 不 是 循环 里 要 处 理 的 字符 串 。 在 那个 迭代 器 上 调用 
skip(1) 会 返回 一 个 新 迭代 器 ， 第 一 次 被 调用 时 ， 这 个 新 迭代 器 会 清除 程序 名 ， 然 后 产生 
后 面 所 有 的 参数 。 


skip_white 适配器 使 用 闵 包 来 决定 清除 序列 开头 的 多 少 项 。 比 如 ， 可 以 像 下 面 这 样 迭 代 上 
一 节 中 的 邮件 正文 : 


for body in message.lines() 
.Skip while(|l| !l.is_empty()) 
.Skip(1) { 
println!("{}" , body); 























这 里 使 用 skip_white 跳 过 非 空 的 行 ， 但 此 时 的 迭代 器 还 会 产生 空 行 ， 因 为 这 个 闭 包 碰 到 空 
行 会 返回 false。 所 以 此 处 又 使 用 skip 方法 跳 过 这 个 空 行 ， 这 样 得 到 的 迭代 器 第 一 项 就 是 
邮件 正文 的 第 一 行 。 对 于 上 一 节 中 的 message， 上 面 的 代码 会 打印 出 以 下 内 容 : 


Did you get any writing done today? 
When will you stop wasting time plotting fractals? 








15.3.6 peekable 
Iterator 特 型 的 peekable 方法 可 以 让 代码 在 不 消费 下 一 项 的 情况 下 探测 下 一 项 。 调 用 这 个 
方法 可 以 将 几乎 任何 迭代 器 转换 为 可 探测 的 迭代 器 : 


fn peekable(self) -> std::iter::Peekable<Self> 
where Self: Sized; 





这 里 ，Peekable<Self> 是 一 个 实现 了 Iterator<Item=Self::Item> 的 结构 体 ， 而 Self 是 底 
层 迭 代 器 的 类 型 。 

Peekable 友 代 器 有 一 个 peek 方法 ， 该 方法 返回 0ption<&Item>: 如 果 底 层 迭 代 器 终止 就 返 
回 None， 否 则 返回 Some(r)， 其 中 r+ 是 下 一 项 的 共享 引用 。( 注 意 ， 如 果 迭 代 器 的 项 类 型 已 
经 是 某 个 值 的 引用 ， 那 就 是 引用 的 引用 ,) 


调用 peek 会 尝试 从 底层 迭代 器 取出 下 一 项 ， 如 果 取 到 了 ， 就 将 其 缓存 到 下 一 次 调用 next。 
Peekable 上 的 其 他 Iterator 方法 都 知道 这 个 缓存 。 例 如 可 探测 迭代 器 iter 上 的 iter. 
last() 在 耗 尽 底层 迭代 器 之 后 知道 检查 缓存 。 

如 果 一 开始 并 不 知道 要 消费 某 个 从 代 器 多 少 项 ， 直 到 消费 过 程 中 才 了 人 解 ， 那 么 可 探测 迭代 
器 是 非常 必要 的 。 例 如 ， 要 从 一 个 字符 流 中 解析 数值 ， 在 发 现 其 后 面 第 一 个 非 数 值 字 符 之 
前 无 法 确定 数值 是 否 结束 : 












































迭代 器 | 275 


use std::iter::Peekable; 


fn parse_number<I>(tokens: &mut Peekable<I>) -> u32 
where I: Iterator<Item=char> 


{ 
let mut n = 0; 
Loop { 
match tokens.peek() { 
Some(r) if r.is digit(10) => { 
n=n* 10 + r.to digit(10).unwrap(); 
_ => return n 
} 
tokens .next() ; 
} 
} 


Let mut chars = "226153980,1766319049".chars().peekable(); 
assert_eq!(parse_number(&mut chars), 226153980); 

// 注意 ，parse_number 没 有 消费 辟 号 ! 因此 要 手工 消费 掉 
assert_ eq!(chars.next(), Some(',')); 
assert_eq!(parse_number(&mut chars), 1766319049); 

assert eq!(chars.next(), None); 























这 个 parse_number 函数 使 用 peek 检查 下 一 个 字符 ， 只 有 该 字符 是 数字 时 才 消 费 它 。 如 果 
不 是 数字 或 者 迭代 器 被 耗 尽 〈 即 peek 返回 None)， 则 返回 已 解析 的 数值 并 把 下 一 个 字符 留 
在 迭代 如 中 供 后面 消 费 。 








LI 
































15.3.7 fuse 


Iterator 特 型 并 未 规定 迭代 器 返回 None 的 情况 下 再 调用 next 应 该 怎么 做 。 大 多 数 迭 代 器 
会 再 次 返回 None， 但 并 非 全 都 如 此 。 如 果 你 的 代码 依靠 这 个 行为 ， 那 可 能 会 遇 到 意外 。 


fuse 适配器 可 以 将 任何 适配器 转换 为 第 一 次 返回 None 之 后 始终 继续 返回 None 的 迭代 器 。 














struct Flaky(bool); 


impl Iterator for Flaky { 
type Item = &'static str; 
fn next(&mut self) -> Option<Self::Item> { 
if seLf.0 { 
seLf.0 = false; 
Some("totally the Last item") 


} elsef 
seLf.0 = true; // 又 来 ! 
None 

} 


} 


Let mut flaky = Flaky(true); 
assert_eq!(fLaky.next()，Some("totaLLy the Last item")); 
assert eq!(flaky.next(), None); 

assert_ eq!(flaky.next(), Some("totally the Last item")); 





Let mut not_fLaky = FLaky(true).fuse(); 
assert_eq!(not_flaky.next(), Some("totally the Last item")); 
assert eq!(not_flaky.next(), None); 
assert_eq!(not_flaky.next(), None); 


fuse 适配器 最 适合 需要 处 理 不 确定 来 源 达 代 器 的 泛 型 代码 。 这 时 候 不 用 假设 所 有 迹 代 器 都 
行为 一 致 ， 可 以 使 用 fuse 确保 这 一 点 。 


15.3.8 可逆 迭代 器 与 rev 


有 些 迭 代 器 可 以 从 序列 两 端 取 得 项 。 可 以 使 用 rev 适配器 反 转 这 种 迭代 器 。 例 如 ， 一 
个 迭代 向 量 的 迭代 器 可 以 转换 为 从 问 量 末 尾 开 始 取 值 。 这 种 迭代 器 可 以 实现 std::iter 
: :DoubleEndedIterator 特 型 ， 该 特 型 扩展 了 Iterator : 





trait DoubleEndedIterator: Iterator { 
fn next_ back(&mut self) -> Option<Self::Item>; 
} 
可 以 将 这 种 双向 迭代 器 想象 为 用 两 根 手指 标记 序列 的 当前 头 和 尾 。 从 任何 一 端 取 值 都 会 导 
致 一 根 手指 向 另 一 根 手 指 靠拢 。 当 两 根 手指 相遇 时 ， 友 代 结束 : 


use std::iter::DoubleEndedIterator; 











Let bee parts = ["head", "thorax", "abdomen"]; 


Let mut iter = bee parts.iter(); 


assert _ eq!(iter .next(), Some(&"head")); 
assert_eq!(iter.next_back(), Some(&"abdomen")); 
assert_eq!(iter.next(), Some(&"thorax")); 


assert_eq!(iter.next_back(), None); 
assert _ eq!(iter .next(), None); 


基于 切片 的 旬 代 器 可 以 方便 地 实现 这 个 行为 ， 因 为 它 实 际 上 就 是 一 对 指针 ， 分 别 指向 尚未 产 
生 元 素 的 头 和 尾 。next 和 next_back 不 过 是 简单 地 从 头 部 或 尾部 取出 一 项 而 已 。BTreeset 和 
BTreeMap 等 有 序 集合 的 迭代 器 也 是 可 以 两 端 取 值 的 ， 即 它们 的 next_back 方法 会 先 取得 最 大 
的 元 素 或 条 目 。 一 般 来 说 ， 只 要 有 实用 性 ， 标 准 库 都 会 提供 两 端 迭 代 的 能 力 。 

不 过 并 不 是 所 有 友 代 器 都 可 以 实现 两 端 迭 代 。 比 如， 基于 另 一 个 线程 返回 给 Receiver 值 的 
友 代 器 就 无 法 预算 接收 到 的 最 后 一 个 值 是 什么 。 通 常 ， 要 查询 标准 库 文档 来 确定 一 个 迭代 
器 是 否 实现 了 DoubLeEndedIterator。 

如 果 迭 代 堪 实现 了 DoubLeEndedIterator ， 则 可 以 使 用 rev 适配器 将 其 反 转 : 


fn rev(self) -> Some Iterator<Item=SeLf> 
where Self: Sized + DoubleEndedIterator; 


的 迭代 器 同样 支持 两 端 取 值 ， 其 next 和 next_back 方法 只 是 简单 地 互 换 了 一 下 : 


let meals = ["breakfast", "lunch", "dinner"]; 









































岗 
回 | 





let mut iter = meals.iter().rev(); 
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assert_eql(iter.next()，Some(&"dinner")); 
assert eq!(iter.next(), Some(&"Llunch")); 
assert eq!(iter.next(), Some(&"breakfast")); 
assert eq!(iter.next(), None); 


在 应 用 给 可 逆 迭 代 器 之 后 ， 大 多 数 迭 代 器 适配器 会 返回 另 一 个 可 逆 迭 代 器 。 例 如 ，map 和 
filter 都 具有 可 逆 性 。 


15.3.9 inspect 


inspect 适配器 可 以 方便 地 用 于 迁 代 器 适配器 管道 的 调试 ， 但 在 产品 代码 中 用 得 不 多 。 这 
个 适配器 只 是 简单 地 对 每 一 项 的 共享 引用 应 用 一 个 闭 包 ， 然 后 再 产生 相应 的 项 。 闭 包 不 影 
响 产生 的 项 ， 但 可 以 打印 项 或 对 项 执行 断言 


下 面 的 例子 展示 了 把 字符 串 转 换 为 大 写 会 改变 其 长 度 : 


Let upper_case: String = "grofpge" .chars() 
.inspect(|c| println!("before: {:?}", c)) 
.flat_map(|c| c.to_uppercase()) 

.inspect(|c| println!(" after: E22} EE)) 
.collect(); 
assert_eq!(uypper_case, "GROSSE"); 


把 小 写 德 语 字 母 “B” 转 换 为 大 写 后 是 “SS”， 这 也 是 char::to_uppercase 会 返回 字符 迭 


代 器 的 原因 ， 因 为 大 小 写字 母 的 数量 并 非 一 一 对 应 的 。 前 面 的 代码 使 用 fLat_map 把 to_ 
uppercase 返回 的 所 有 序列 都 拼接 为 一 个 String， 然 后 将 它们 打印 出 来 : 
































before: 'g' 
after : "6G" 
before: 'r’ 
after: "RY 
before: 'o'’ 
after: '0' 
before: 'B®' 
after: ‘SY 
after: Sy 
before: 'e' 
after: SE 


15.3.10 chain 

chain 适配器 会 将 一 个 迭代 器 添加 到 另 一 个 适配器 后 面 。 更 具体 地 说 ，i1.chain(1i2) 会 返 
回 一 个 迭代 器 ， 该 迭代 器 先 从 i1 中 提取 项 ， 取 完 后 再 继续 从 i2 中 提取 项 。 

chain 适配器 的 签名 如 下 : 


fn chain<U>(self, other: U) -> some Iterator<Item=Self::Item> 
where Self: Sized, U: IntoIterator<Item=SeLf: :Item>; 


换 句 话说， 可 以 将 迭代 器 与 任何 产生 相同 项 类 型 的 可 迭代 类 型 连 绥 在 一 块 。 例 如 : 


Let v: Vec<i32> = (1..4).chain(vec![20, 30, 40]).collect(); 
assert eq!(v, [1, 2, 3, 20, 30, 40]); 























如 果 连 级 的 两 个 迭代 器 都 是 可 逆 的 ， 则 chain 返回 的 迭代 器 也 是 可 逆 的 : 


Let v: Vec<i32> = (1..4).chain(vec![20, 30, 40]).rev().collect(); 
assert_eq!(v, [40, 30, 20, 3, 2, 1]); 


chain 从 代 器 会 跟踪 底层 的 迭代 器 是 否 返 回 None， 根 据 情 况 调用 其 个 底层 途 代 器 的 next 和 


next_back 。 





15.3.11 enumerate 

Iterator 特 型 的 enumerate 适配器 可 以 向 序列 中 添加 连续 的 索引 。 对 于 产生 项 为 A,B,C... 的 
迭代 器 ， 其 返回 的 迭代 器 则 产生 (6，A),(1，B),(2，C)... 乍 一 看 这 没什么 用 ,但 实际 上 用 
处 很 大 。 

消费 者 可 以 通过 索引 区 别 不 同 的 项 ， 从 而 建立 处 理 每 一 项 的 上 下 文 。 例 如 ， 第 2 章 示 例 的 
曼 德 布 洛 特集 合 绘图 器 将 图 像 切 分 成 8 个 水 平 的 长 条 ， 并 把 每 个 长 条 分 别 分 派 给 一 个 不 同 
的 线程 。 代 码 中 使 用 enumerate 告诉 每 个 线程 其 长 条 对 应 图 像 的 哪 一 部 分 。 

从 矩形 的 像素 缓冲 区 开始 : 


let mut pixels = vec![0; columns * rows]; 


然后 使 用 chunks_mut 将 图 像 切 分 成 水 平 长 条 ， 每 个 线程 分 派 一 个 


let threads = 8; 
Let band_rows = rows / threads + 1; 








Let bands: Vec<&mut [u8]> = pixels.chunks_mut(band_rows * columns).collect(); 


再 迭代 这 些 长 条 ， 为 每 个 长 条 启动 一 个 线程 : 


for (i, band) in bands.into iter().enumerate() { 
let top = band_rows * i; 
// 启动 一 个 线程 演 染 top. .top + band_rows 行 
} 
这 里 每 次 迭代 都 得 到 一 对 值 (i，band)， 其 中 band 是 线程 应 该 泻 染 的 像素 缓冲 的 &mut [u8] 
切片 ， 而 宇 是 相应 长 条 在 整个 图 像 中 的 索引 。 这 个 索引 是 拜 本 节 的 enumerate 适配器 所 赐 。 
有 了 绘图 的 边界 和 长 条 大 小 ， 每 个 线程 就 会 知道 分 派 给 自己 的 是 图 像 的 哪 一 部 分 ， 也 就 知 
道 了 要 把 什么 绘制 到 band。 























15.3.12 zip 

zip 适配器 将 两 个 适配器 组 合 为 一 个 适配器 ， 产 生 之 前 两 个 迭代 器 项 的 项 对 ， 就 像 拉 链 把 
分 开 的 两 边 拼 在 一 起 一 样 。 
例如 ， 可 以 像 下 面 这 样 将 半 开 范 国 
适配器 同样 的 效果 : 


let v: Vec< > = (0..).zip("ABCD".chars()).collect(); 
assert_eq!(v, vec![(0, 'A'), (1, 'B'), (2, 'C'), (3, 'D')]); 
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© 








. 与 其 他 迭代 器 组 合 在 一 起 ， 得 到 与 使 用 enumerate 
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从 这 个 意义 上 讲 ， 可 以 把 zip 看 成 通用 化 的 enumerate。enumerate 只 能 给 其 他 序列 添加 索 
引 ， 而 zip 可 以 添加 任何 迭代 项 。 前 面 提 到 enumerate 可 以 为 处 理 产生 项 提供 上 下 文 ， 而 
zip 是 达成 相同 目的 更 灵活 的 方式 。 

传 给 zip 的 参数 不 一 定 是 运 代 器 本 身 ， 可 以 是 任何 可 迭代 类 型 ; 


use std::iter::repeat; 



































Let endings = vec!["once", "twice", "chicken soup with rice"]; 
let rhyme: Vec< > = repeat("going") 
.zip(endings) 
.Ccollect(); 
assert_ eq!(rhyme, vec![("going", "once"), 
("going", "twice"), 
("going", "chicken soup with rice")]); 


15.3.13 by_ref 


本 节 前 面 介绍 的 都 是 把 适配器 应 用 到 迭代 器 。 那 么 应 用 之 后 ， 还 能 再 取 背 适配器 吗 ? 通常 
情况 下 不 能 ， 因 为 适配器 会 取得 底层 迭代 器 的 所 有 权 ， 没有 办 法 再 退回 去 了 。 


迁 代 器 的 by_ref 方法 可 以 借用 迭代 器 的 一 个 可 修改 引用 ， 以 便 我 们 能 够 把 适配器 应 用 给 这 
个 引用 。 在 通过 适配器 消费 完 和 迭代 器 的 项 之 后 ， 借 用 结束 ， 恢 复 对 原始 迭代 器 的 访问 。 


例如 ， 本 章 前 面 展示 了 使 用 take_while 和 skip_while 处 理 邮件 的 标题 行 和 正文 。 如 果 想 
基于 同一 个 底层 迭代 器 完成 这 两 个 操作 该 怎么 办 ?使 用 by_ref 可 以 让 take_while 处 理 标 
题 行 ， 处 理 完 之 后 ， 再 回 到 底层 迭代 器 ，take_white 剩 下 的 正好 是 邮件 正文 : 
Let message = "To: jimb\r\n\ 
From: id\r\n\ 
NArNn\ 


O00oo00oh, donuts!!\r\n"; 
















































































Let mut lines = message.lines(); 


println!("Headers:"); 

for header in lines.by_ref().take while(|l| !l.is empty()) { 
println!("{}"” , header); 

} 


println!("\nBody:"); 
for body in lines { 
println!("{}" , body); 


Lines.by_ref() 调用 从 返 代 器 借用 了 一 个 可 修改 引用 ， 而 take_while 兴 代 器 只 是 取得 了 这 
个 引用 的 所 有 权 。 第 一 个 for 循环 结束 时 ，take_while 人 达 代 器 离开 作用 域 ,， 借 用 关系 随 之 
终止 。 因 此 ， 又 可 以 在 第 二 个 for 循环 中 继续 使 用 Lines 了 。 打 印 的 最 终结 果 如 下 : 

Headers : 

To: jimb 

From: id 











Body : 
0ooooh，donuts!! 


y_ref 适配器 的 定义 很 简单 ， 就 是 返回 迭代 器 的 可 修改 引用 。 然 后 ， 标 准 库 就 包含 了 下 面 
个 奇怪 的 小 实现 : 


impl<'a, I: Iterator + ?Sized> Iterator for &'a mut I { 
type Item = I::Itenm; 
fn next(&mut seLf) -> Option<I::Item> { 
(**self).next() 
} 
fn size hint(&self) -> (usize, Option<usize>) { 
(**self).size hint() 
} 
} 


er et et eee ec et eri 
法 会 解 引 用 到 它 的 引用 值 。 在 对 友 代 器 的 可 修改 引用 调用 适配器 时 ， 适 配器 取得 引用 而 非 
迭代 器 本 身 的 所 有 权 。 这 就 是 在 适配器 超出 作用 域 时 会 终止 的 一 个 借用 关系 。 














15.3.14 cloned 


cloned 适配器 将 一 个 产生 引用 的 迭代 器 转换 为 产生 基于 引用 克隆 的 值 的 和 欠 代 器 。 自 然 地 ， 
引用 值 的 类 型 必须 实现 Clone。 例 如 : 


Let a = [es yo Ga Door w]e 








assert_eq!(a.iter().next(), Some(&'1')); 
assert_ eq!(a.iter().cloned().next(), Some('1')); 


15.3.15 cycle 


cycle 适配器 返回 一 个 无 休止 重复 底层 运 代 器 的 运 代 器 。 底 层 友 代 器 必须 实现 std: :clone 
::CLone， 以 便 cycle 可 以 保存 其 初始 状态 并 在 每 次 循环 开始 时 重用 。 例 如 ; 


Let dirs = ["North", "East", "South", "West"]; 
let mut spin = dirs.iter().cyclel(); 

assert eq!(spin.next(), Some(&"North")); 
assert eq!(spin.next(), Some(&"East")); 
assert_ eq!(spin.next(), Some(&"South")); 
assert_eq!(spin.next(), Some(&"West")); 
assert_eq!(spin.next(), Some(&"North")); 
assert_eq!(spin.next(), Some(&"East")); 


再 看 另 一 个 使 用 迭代 器 的 例子 ， 


use std::iter::{once, repeat}; 











let fizzes = repeat("").take(2).chain(once("fizz")).cycle(); 
let buzzes = repeat("").take(4).chain(once("buzz")).cycle(); 
Let fizzes buzzes = fizzes.zip(buyzzes); 
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Let fizz_buzz = (1..100).zip(fizzes_buzzes) 
.map(|tuptel| 
match tuple { 
(tL, "", ™™)) 35 Tto. string(), 
(_, (fizz, buzz)) => format!("{}{}", fizz, buzz) 
]); 


for line in fizz buzz { 
println!("{}", line); 





这 本 来 是 一 个 小 孩子 的 文字 游戏 ， 但 现在 有 时候 会 用 作 程 序 员 的 面试 题 。 玩 家 要 通过 计 
算 ， 用 “fizz” 替 换 可 以 被 3 整除 的 数 ， 用 “buzz” 替 换 可 以 被 5 整除 的 数 。 可 以 同时 被 两 
者 整除 的 数 就 会 得 到 “fizzbuzz 。 


15.4 消费 迁 代 器 

目前 为 止 ， 本 书 讨 论 的 都 是 创建 迭代 器 ， 以 及 通过 适配器 将 它们 变 成 新 迭代 器 。 本 市 开始 
介绍 消费 迭代 器 。 

当然 ， 使 用 for 循环 也 可 以 消费 迭代 器 ， 直 接 调用 next 也 行 。 但 是 ， 有 很 多 常见 的 任务 不 
需要 每 次 都 这 样 重复 地 写 出 来 。Iterator 特 型 提供 了 很 多 方法 ， 可 以 直接 完成 这 些 任务 。 














15.4.1 简单 累计 : count、sum 和 product 
count 方法 从 一 个 迭代 器 中 取 值 ， 直 到 它 返 回 None， 然 后 告诉 你 这 个 迭代 器 包含 多 少 项 。 
下 面 这 个 示例 计算 标准 输入 的 行 数 : 


use std::io::prelude::*; 


fn main() { 

let stdin = std::io::stdin(); 

println!("{}", stdin.lock().lines().count()); 
} 


sum 和 product 方法 分 别 用 于 计算 迭代 器 项 的 和 与 积 。 当 然 ， 迭 代 器 


fn triangle(n: u64) -> 464 { 
(1..n+1).sum() 








时 


整数 或 浮 点 数 : 


} 
assert_eq!(triangle(20), 210); 


fn factorial(n: u64) -> u64 { 
(1..n+1).product() 


assert_eq!(factoriaL(20)，2432902008176640000 ) ; 


(通过 实现 std: :iter::Sum 和 std::iter::Product 特 型 可 以 扩展 sum 和 product 方法 ， 以 处 
里 其 他 类 型 。 本 书 没有 介绍 这 两 个 特 型 。) 


= 











15.4.2 max 和 min 
Iterator 上 的 max 和 min 方法 分 别 返 回 迭 代 器 产生 项 的 最 大 值 和 最 小 值 。 迭 代 器 的 项 类 型 
必须 实现 std: :cmp::0rd， 这 样 项 与 项 之 间 才 能 比较 。 例 如 : 


assert_eq!( 
assert_eq!( 


这 两 个 方法 返回 0ption<Self::Item>， 因 此 在 迭代 器 没有 产生 项 时 返回 None。 

正如 12.2 节 所 解释 的 ，Rust 的 浮 点 类 型 f32 和 f64 只 实现 了 std::cmp::Partialord， 没 有 
实现 std: :cmp::0rd。 因 此 不 能 使 用 max 和 min 比较 浮 点 值 序列 的 最 大 值 和 最 小 值 。Rust 这 
种 不 迎合 大 众 口 味 的 设计 是 有 意 的 ， 因 为 该 如 何 处 理 IEEE 的 NaN 值 这 些 函 数 并 不 确定 。 
如 果 简 单 地 忽略 它们 则 可 能 在 代码 中 引入 更 严重 的 问题 。 

如 果 你 知道 如 何 处 理 NaN 值 ， 那 么 可 以 使 用 max_by 和 min_by 迭代 器 方法 。 这 两 个 方法 支 
持 提供 自 定义 比较 方法 。 

















,， 0, 1, 0, -2, -5].iter().max(), Some(&1)); 
0 1 0 


[-2 
[-2, 0, 1, 0, -2, -5].iter().min(), Some(&-5)); 
























































15.4.3 max_by 和 min_by 
max_by 和 min_by 方法 根据 提供 的 自 定义 比较 方法 返回 迭代 器 产生 的 最 大 值 和 最 小 值 : 


use std::cmp::{PartialOrd, Ordering}; 


// 比较 两 个 f64 值 。 如 果 包 含 NaN 则 沱 异 

fn cmp(Lhs: &&f64, rhs: &&f64) -> Ordering { 
lhs.partial_cmp(rhs) .unwrap() 

} 


Let numbers = [1.0, 4.0, 2.0]; 
assert _ eq!(numbers.iter().max_by(cmp), Some(&4.0)); 
assert_eq!(numbers.iter().min by(cmp), Some(&1.0)); 


let numbers = [1.0, 4.0, std::f64::NAN, 2.0]; 
assert_eq!(numbers.iter().max_by(cmp), Some(&4.0)); // 许 异 
(这 里 cmp 参数 的 双重 引用 是 因为 numbers.iter() 产生 对 元 素 的 引用 ， 然 后 max_by 和 min_ 
by 又 把 迭代 器 项 的 引用 传 给 闭 包 ,) 


15.4.4 max_by_key 和 和 min_by_key 


Iterator 上 的 max_by_key 和 min_by_key 方法 可 以 根据 应 用 到 每 一 项 的 闭 包 选 择 最 大 或 最 
小 的 项 。 闭 包 可 以 选择 项 的 某 个 字段 ， 或 者 对 每 一 项 执行 某 些 计算 。 我 们 通常 并 不 关心 
这 些 极 值 本 身 ， 而 只 关心 与 最 大 项 或 最 小 项 关联 的 数据 。 因 此 ， 这 两 个 方法 通常 比 max 和 
min 也 更 有 用 。 它 们 的 签名 如 下 : 


fn min_by_key<B: Ord, F>(self, f: F) -> Option<Self::Item> 
where Self: Sized, F: FnMut(&Self::Item) -> B; 


fn max_by_key<B: Ord, F>(self, f: F) -> Option<Self::Item> 
where Self: Sized, F: FnMut(&Self::Item) -> B; 
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这 也 就 是 说 ， 对 给 定 的 以 每 一 项 作为 参数 且 返 回 有 序 类 型 8 的 闭 包 ， 它 们 返回 闭 包 返 回 的 
B 最 大 或 最 小 的 项 。 如 果 没 有 产生 项 ， 则 返回 None。 


例如 ， 如 果 要 从 一 个 城市 的 散 列 表 中 找到 其 中 人 口 最 多 和 最 少 的 城市 ， 可 以 这 样 做 : 


use std::collections::HashMap; 




















Let mut populations = HashMap: :new(); 
populations.insert("Portland", 583_776); 


populations.insert("Fossil", 449); 
populations.insert("Greenhorn", 和) 
populations.insert("Boring", 7_762); 


populations.insert("The Dalles", 15_340); 


assert_ eq!(populations.iter().max_by_key(|&(_name, pop)| pop)， 
Some((&"Portland", &583_776))); 

assert_ eq!(populations.iter().min by_key(|&(_name, pop)| pop)， 
Some((&"Greenhorn", &2))); 


这 里 的 闭 包 |&(_name，pop)| pop 会 应 用 于 迭代 器 产生 的 每 一 项 ， 返 回 的 值 则 用 于 比较 。 
在 这 个 例子 中 返回 的 是 人 口 ， 因 此 就 会 比较 人 口 。 返 回 的 值 是 整个 项 ， 而 不 是 闭 包 返回 的 
值 。( 自 然 地 ， 如 果 需 要 频繁 进行 这 样 的 查询 ， 那 么 可 能 需要 找到 一 种 更 有 效 的 查询 方式 ， 
而 不 是 像 这 样 对 散 列 表 执 行 线性 搜索 。) 


15.4.5 ”比较 项 序列 


可 以 使 用 < 和 == 操作 符 比 较 字 符 串 、 向 量 和 切片 ， 假 设 它们 的 每 个 元 素 都 是 可 以 比较 的 。 
尽管 伙 代 器 不 支持 Rust 的 比较 操作 符 ， 但 它们 提供 了 eq 和 1t 等 方法 以 实现 同样 的 功能 。 
这 些 方法 从 进 代 器 中 取得 成 对 的 项 ， 然 后 对 它们 进行 比较 ， 直 到 可 以 做 出 决定 。 例 如 

Let packed "Helen of Troy"; 


let spaced "Helen of Troy"; 
Let obscure = "Helen of Sandusky"; // 不 错 的 人 ， 只 是 名 气 不 大 















































assert!(packed != spaced); 
assert!(packed.split whitespace().eq(spaced.split whitespace())); 


// 返回 true， 因 为 '' < '0' 
assert!(spaced < obscure); 














// 返回 true， 因 为 'Troy' > 'Sandusky' 

assert!(spaced.split whitespace().gt(obscure.split whitespace())); 
调用 split_whitespace 返回 的 迭代 器 产生 以 空格 分 割 字 符 串 得 到 的 单词 。 调 用 迭代 器 的 eq 
和 gt 方法 可 以 执行 单词 与 单词 的 比较 ， 而 不 是 字符 与 字符 的 比较 。 之 所 以 可 以 这 样 ， 是 
因为 &str 实现 了 PartiaLord 和 PartialEq。 
迭代 器 既 提 供 了 eq 和 ne 方法 用 于 相等 性 比较 ， 也 提供 了 Lt、Le、9gt 和 ge 方法 用 于 次 序 
比较 。cmp 和 partial_cmp 方法 与 0rd 和 Partialord 特 型 上 对 应 的 方法 类 似 。 

















15.4.6 


any 和 alLL 


any 和 all 方法 给 迭代 器 产生 的 每 一 项 应 用 闭 包 ， 如 果 闭 包 对 其 中 一 项 或 全 部 项 返回 true， 
则 返回 true: 


let id = "Iterator"; 





assert!( id.chars().any(char::is_ uppercase)); 
assert!(!id.chars().all(char::is uppercase)); 


这 些 方 法 





只 消费 确定 答案 必要 的 项 。 例 如 ， 如 果 闲 包 对 某 一 项 返回 true， 那 any 就 立即 返 


回 true， 而 不 会 再 从 迭代 器 中 取 更 多 项 。 


15.4.7 position、rposition 和 ExactSizeIterator 


position 方法 给 迭代 器 产生 的 每 一 项 应 用 亲 包 ， 返 回 团 包 返 回 true 的 第 一 项 的 索引 。 更 
精确 地 说 ，position 返回 一 个 索引 的 0ption: 如 果 闭 包 对 任何 项 都 没有 返回 true， 则 返回 
None。 只 要 闭 包 返回 true，position 就 停止 取 值 。 例 如 : 

















let text = "Xerxes"; 
assert eq!(text.chars().position(|c| c == 'e'), Some(1)); 
assert_ eq!(text.chars().position(|c| c == 'z'), None); 


rposition 方法 与 position 方法 相同 ， 只 是 其 从 右 侧 进行 搜索 。 例 如 : 


let bytes = b"Xerxes"; 
assert_eq!(bytes.iter().rposition(|&c| c == b'e'), Some(4)); 
assert eq!(bytes.iter().rposition(|&c| c == b'X'), Some(0)); 


rposition 方法 要 求 使 用 可 逆 迭 代 器 ， 这 样 才 能 从 序列 右 端 取 值 。 另 外 ， 它 也 要 求 迭代 器 
大 小 固定 ， 这 样 才能 像 position 那样 为 索引 赋值 ， 以 最 左边 的 项 为 0。 固 定 大 小 迭代 器 是 
指 实 现 std: :iter::ExactSizeIterator 特 型 的 夫 代 器 : 








pub trait ExactSizeIterator: Iterator { 
fn Len(&seLf) -> usize { ... } 
fn is_empty(&self) -> booL { ... } 


3 














其 中 ，len 方法 返回 剩余 项 数 ， 而 is_empty 方法 在 迭代 完成 时 返回 true。 





当然 ， 并 不 是 所 有 迭代 器 都 能 提前 知道 自己 会 产生 多 少 项 ， 在 前 面 的 例子 中 ， 产 生 &str 的 
chars 迭代 器 就 不 知道 (UTF-8 是 变 长 编码 )。 因 此 不 能 对 字符 串 使 用 rposition。 但 产生 
字 节 数组 的 返 代 器 知道 数组 长 度 ， 因 此 可 以 实现 ExactSizeIterator。 




















15.4.8 fold 


fold 方法 是 一 个 通用 工具 ， 可 以 对 迭代 器 产生 项 的 整个 序列 执行 某 些 累计 操作 。 这 个 方法 
接收 一 个 名 为 累加 器 (accumulator) 的 初始 值 和 一 个 闭 包 ， 然 后 对 当前 累加 器 和 迭代 器 的 
下 一 项 重复 应 用 闲 包 。 每 次 闭 包 的 返回 值 都 会 成 为 累加 器 的 新 值 ， 然 后 再 和 返 代 器 的 下 一 
项 一 块 传 给 闭 包 。 累 加 器 的 最 终 值 也 是 fold 方法 返回 的 值 。 如 果 序 列 是 空 的 ， 则 fold 返 


























迭代 器 | 285 





回 累 加 器 的 初始 值 











o 




















let a = [5, 6, 7, 8, 9, 10]; 


assert eq!(a.iter().fold(0, |n, _| n+1), 
assert eq!(a.iter().fold(0, |n, i| n+i), 


assert eq!(a.iter().fold(1, |n, i| n*i), 151200); 


// max 


6); 
45); 


消费 迭代 器 值 的 许多 其 他 方法 可 以 写成 使 用 fold 的 形式 : 


// count 


// sum 


// product 


assert eq!(a.iter().fold(i32::min _value(), |m, &i| std::cmp::max(m, i)), 


10); 


fold 方法 的 签名 如 下 : 


fn fold<A, F>(self, init: A, f: F) -> A 
where Self: Sized, F: FnMut(A, Self: 


这 里 ，A 是 累加 器 类 型 。init 参数 是 一 个 A， 闭 包 的 第 





的 返回 值 都 是 A。 











:Item) -> A 


一 个 参数 及 返回 


值 


， 还 有 fold 本 身 


注意 ， 累 加 器 的 值 会 转移 到 闭 包 中 再 转移 出 来 ， 因 此 可 以 对 非 Copy 类 型 的 累加 器 使 用 fold: 











let a = ["Pack ", "my ", "box ", "with "， 
"jugs"]; 


"five "dozen ", "liquor "， 


3 


Let pangram = a.iter().fold(String::new(), 
Imut s，&w| { s.push_str(w); s }); 
assert eq!(pangram, "Pack my box with five dozen Liquor jugs"); 


15.4.9 nth 
nth 方法 接收 一 个 索引 值 n， 


后 跳 过 进 代 器 中 相应 的 项 ， 返 


此 之 前 结束 ， 则 返回 None。 ， :nth(9) 等 同 于 调用 .next()。 


nth 不 会 像 适 配器 那样 取得 迭 


Let mut squares = (0..10).map(|i| ix*i); 
assert_eq!(squares.nth(4)，Some(16) ); 


assert_eq!(squares.nth(0), Some(25)); 
assert_eq!(squares.nth(6), None); 


这 个 方法 的 签名 如 下 : 


器 的 所 有 权 ， 因 此 可 以 多 次 调用 : 


fn nth(&mut seLf，n: usize) -> Option<Self::Item> 


Where Self: Sized; 


15.4.10 last 


last 方法 消费 每 一 项 ， 直 到 和 友 代 器 返回 None， 
项 ， 则 last 返回 None。 它 的 签名 如 下 : 


fn last(self) -> Option<Self::Item>; 





然后 返 


回 最 后 一 项 。 





女 


荆 


回 索 引 对 应 的 项 ， 如 果 序 列 在 



































失 代 器 不 产生 任何 


采 进 





例如 : 

Let squares = (0..10).map(|i| ix*i); 

assert_eq!(squares.last(), Some(81)); 
这 样 会 从 前 面 开 始 消 费 迭 代 器 的 所 有 项 ， 即 使 迄 代 器 是 可 逆 的 。 因 此 ， 如 果 达 代 
的 ， 又 不 需要 消费 其 所 有 项 ， 则 可 以 只 写成 iter.rev().next()。 





I 


氏 


局 





可 北 








15.4.11 find 


find 方 法 从 和 迭代 器 中 取得 第 一 个 闭 包 返回 true 的 值 ， 或 者 如 果 没 有 找到 合适 的 项 则 返回 
None。 它 的 签名 如 下 : 
fn find<P>(&mut self, predicate: P) -> Option<Self::Item> 


where Self: Sized, 
P: FnMut(&Self::Item) -> bool; 


例如 ， 使 用 15.4.4 节 中 城市 和 人 口 的 散 列表 ， 可 以 这 样 查找 : 


assert_eq!(populations.iter().find(|&(_name, &pop)| pop > 1 .000 000)， 
None ) ; 

assert_eq!(popuLations.iter().find(|&(_name，&pop)| pop > 500 000)， 
Some((&"Portland", &583_776))); 


表 中 没有 人 口 超 过 100 万 的 城市 ， 但 有 一 个 城市 人 口 超 过 了 50 万 。 





























15.4.12 构建 集合 : coLLect 和 FromIterator 


本 书 已 经 多 次 使 用 collect 方 法 来 构建 保存 迭代 器 项 的 向 量 。 例 如 ， 第 2 音调 用 
std: :env::args() 取得 了 一 个 程序 命令 行 参 数 的 迭代 器 ， 然 后 调用 这 个 迭代 器 的 collect 
方法 将 它们 汇集 为 了 一 个 向 量 : 

let args: Vec<String> = std::env::args().collect(); 
但 collect 方法 并 不 只 是 针对 向 量 。 事 实 上 ， 它 可 以 用 来 构建 Rust 标准 库 中 的 任何 集合 ， 
只 要 迭 代 器 产生 类 型 合适 的 项 就 行 : 


use std::collections::{HashSet, BTreeSet, LinkedList, HashMap, BTreeMap}; 








let args: HashSet<String> = std::env::args().collect(); 
let args: BTreeSet<String> = std::env::args().collect(); 
Let args: LinkedList<String> = std::env::args().collect(); 


// 汇集 映射 需要 (key，value) 对 ， 因 此 对 这 个 例子 而 言 ， 

// 可 以 使 用 zip 为 字符 串 添加 整数 索引 

Let args: HashMap<String, usize> = std::env::args().zip(0..).collect(); 
let args: BTreeMap<String, usize> = std::env::args().zip(0..).collect(); 








// 更 多 例子 


自然 地 ，collect 本 身 并 不 知道 如 何 构 建 这 些 类 型 。 相 反 地 ，Vec 或 HashMap 等 集合 类 型 知 
道 如 何 基于 达 代 器 构建 自己 ， 所 以 它们 实现 了 std: :iter::FromIterator 特 型 ， 而 collect 
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只 是 一 个 快捷 方式 而 已 : 


trait FromIterator<A>: Sized { 
fn from iter<T: IntoIterator<Item=A>>(iter: T) -> Self; 


} 
如 果 某 个 集合 类 型 实现 了 FromIterator<A>， 那 么 其 静态 方法 from_iter 就 可 以 基于 产生 类 
型 A 的 可 迭代 类 型 构建 该 类 型 的 值 。 
在 最 简单 的 情况 下 ， 实 现 可 以 简单 地 构建 一 个 空 集合 ， 然 后 逐个 将 迭代 器 产生 的 项 添加 到 
这 个 集合 中 。 例 如 ，std::collections::LinkedList 对 FromIterator 的 实现 就 是 这 样 做 的 。 


不 过 ， 某 些 类 型 的 实现 方式 可 以 更 好 一 些 。 例 如 ， 基 于 迭代 器 iter 构建 一 个 向 量 可 以 像 下 


面 这 么 简单 : 




















Let mut vec = Vec::new(); 
for item in iter { 
vec.push(item) 


vec 
但 这 并 不 理想 。 随 着 向 量 增长 ， 可 能 需要 扩展 其 缓冲 区 ， 要 求 调用 堆 分 配器 以 及 复制 已 有 
元 素 。 向 量 确 实在 算法 上 考虑 到 了 保持 这 个 过 程 的 开销 最 低 ， 但 如 果 有 革 种 方式 可 以 简单 
地 将 初始 缓冲 区 一 开始 就 分 配 为 合适 大 小 ， 则 无 须 再 调用 大 小 了 。 

这 也 是 Iterator 特 型 有 一 个 size_hint 方法 的 原因 : 


trait Iterator { 


























fn size hint(&self) -> (usize, Option<usize>) { 
(0, None) 
} 
} 


size_hint 方法 返回 迭代 器 产生 项 数 的 下 限 值 和 可 选 的 上 限 值 。 默 认定 义 是 返回 0 作为 下 
限 值 ， 不 给 出 上 限 值 ， 相 当 于 说 “不 知道 ”。 但 很 多 迭代 器 可 以 对 此 给 出 更 有 用 的 信息 。 
例如 ， 产 生 Range 的 迭代 器 就 知道 自己 要 产生 多 少 值 ， 产 生 Vec 和 HashMap 的 迭代 器 也 一 
样 。 这 些 迭 代 器 都 提供 了 自己 的 对 size_hint 的 特殊 定义 。 

这 两 个 边界 值 正 是 Vec 对 FromIterator 的 实现 从 一 开始 就 为 新 向 量 缓冲 区 分 配 正确 大 小 所 
必需 的 信息 。 插 入 值 时 仍然 会 检查 缓冲 区 是 否 够 大 ， 因 此 即使 这 个 提示 信息 不 正确 ， 也 只 
会 影响 性 能 ， 而 不 会 影响 安全 。 其 他 类 型 也 可 以 如 法 炮制 。 例 如 ，Hashset 和 HashMap 也 会 
使 用 Iterator: :size_hint 为 自己 的 散 列表 创建 适当 的 初始 大 小 。 

这 里 有 一 个 关于 类 型 推断 的 问题 。 在 前 面 的 例子 中 ， 同 样 是 调用 std::env::args(). 
collect() 却 会 根据 上 下 文 产 生 4 种 不 同 的 集合 。 这 看 起 来 可 能 有 点 奇怪 。 实 际 上 ， 
collect 的 返回 类 型 是 其 类 型 参数 ， 因 此 前 两 个 调用 相当 于 : 


let args = std::env::args().collect::<vec<String>>(); 
Let args = std::env::args().collect::<HashSet<String>>(); 


不 过 ， 哪 怕 只 有 一 个 适合 cotlect 参数 的 类 型 ，Rust 的 类 型 推断 都 会 提供 出 来 。 像 这 样 明 
































确 写 出 args 的 参数 ， 可 以 保证 类 型 正确 。 


15.4.13 Extend 特 型 
如 果 类 型 实现 了 std::iter::Extend 特 型 ， 那 么 它 的 extend 方法 可 以 将 一 个 友 代 器 的 项 添 
加 到 集合 中 : 

Let mut v: Vec<i32> = (0..5).map(|i| 1 << i).collect(); 

v.extend(&[31, 57, 99, 163]); 

assert eq!(v, &[1, 2, 4, 8, 16, 31, 57, 99, 163]); 
所 有 的 标准 库 集合 都 实现 了 Extend， 因 此 它们 都 支持 这 个 方法 ，String 也 一 样 。 但 固定 长 
度 的 数组 和 切片 不 支持 这 个 方法 。 
这 个 特 型 的 定义 如 下 所 示 : 


trait Extend<A> { 
fn extend<T>(&mut self, iter: T) 
where T: IntoIterator<Item=A>; 

















} 


显然 ， 这 跟 std::iter::FromIterator 韭 常 相似 。std::iter::FromIterator 创建 一 个 新 集 
合 ， 而 Extend ee 合 。 事 实 上 ， 标 准 库 中 的 一 些 FromIterator 实现 就 是 先 创建 一 
个 新 的 空 集 合 ， 然 后 再 调用 tend 填充 这 个 集合 。 例 如 ，std::collections::LinkedList 
总 潜入 Sh Fioniterdtor 的 : 

















impl<T> FromIterator<T> for LinkedList<T> { 
fn from iter<I: IntoIterator<Item = T>>(iter: I) -> Self { 
Let mut list = Self::new(); 
list.extend(iter); 
titst 


15.4.14 partition 

partition 方法 把 一 个 达 代 器 的 项 分 成 两 个 集合 ， 然 后 使 用 闭 包 决 定 哪 一 项 属于 哪个 集合 : 
let things = ["doorknob", "mushroom", "noodle", "giraffe", "grapefruit"]; 
// 震惊 : 凡是 有 生命 的 ， 其 名 字 的 首 字母 始终 是 奇数 个 字母 


Let (living, nonliving): (Vec<&str>, Veec<&strsy 
= things.iter().partition(|name| name.as_bytes()[0] & 1 != 0); 


assert_eq!(living, vec!["mushroom", "giraffe", "grapefruit"]); 
assert_eq!(nonliving, vec!["doorknob", "noodle"]); 


与 collect 类 似 ，partition 可 以 生成 任何 类 型 的 集合 (当然 两 个 集合 必须 是 相同 类 型 ) 。 
但 与 coLLect 不 同 ， 这 里 需要 指定 返回 类 型 : 前 面 的 例子 写 出 了 Living 和 nonliving 的 类 
型 ， 让 类 型 推断 可 以 选择 调用 正确 的 类 型 参数 。 
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partition 的 签名 如 下 : 


fn partition<B, F>(self, f: F) -> (B, B) 
where Self: Sized, 
B: Default + Extend<Self::Item>, 
F: FnMut(&Self::Item) -> bool; 


collect 要 求 其 结果 类 型 实现 FromIterator，partition 则 要 求 其 结果 类 型 实现 std: :default 
::Default (对 此 ， 所 有 Rust 集合 的 实现 都 是 返回 一 个 空 集合 ) 和 std: :default: :Extend。 


partition 为 什么 不 把 迄 代 器 分 成 两 个 迭代 器 ， 而 是 两 个 集合 呢 ? 一 个 原因 是 从 底层 迭代 
器 中 取出 但 还 没有 从 切 分 后 的 迭代 器 中 取出 的 值 需 要 先 缓存 在 某 个 地 方 ， 而 这 最 终 可 能 需 
要 在 内 部 先 构 建 某 种 集合 。 但 更 本 质 的 原因 是 这 跟 安 全 相关 。 把 一 个 返 代 器 切 成 两 个 需要 
两 部 分 共享 同一 个 底层 迭代 器 ， 而 迭代 器 必须 可 以 修改 才能 使 用 。 底 层 迭 代 器 必须 共享 且 
可 修改 对 Rust 来 说 是 违背 安全 准则 的 。 


15.5 ”实现 自己 的 迭代 器 


自 定 义 类 型 也 可 以 实现 IntoIterator 和 Iterator 特 型 ， 从 而 可 以 让 本 章 介绍 的 所 有 适 配 
器 和 消费 者 都 派 上 用 场 ， 当 然 还 包括 使 用 标准 迭代 器 接口 的 第 三 方 库 。 本 节 先 介绍 基于 一 
个 范围 类 型 实现 简单 的 迭代 器 ， 再 介绍 基于 一 个 二 又 树 类 型 实现 较 复 杂 的 迭代 器 。 
假设 有 如 下 范围 类 型 (在 标准 库 std: :ops: :Range<T> 类 型 基础 上 做 了 简化 ) : 

struct I32Range { 


start: i32, 
end: i32 





























} 


迭代 I32Range 需要 两 个 状态 : 当前 值 和 结束 和 迭代 的 限制 条 件 。 对 于 I32Range 而 言 ， 可 以 
使 用 start 作为 下 一 个 值 ， 使 用 end 作为 限制 条 件 。 因 此 ， 可 以 像 下 面 这 样 实现 Iterator: 


impl Iterator for I32Range { 
type Item = i32; 
fn next(&mut self) -> Option<i32> { 
if self.start >= self.end { 
return None; 




















站 
Let result = Some(seLf .start); 
seLf .start += 1; 
result 
} 
} 


这 个 迭代 器 产生 i32 类 型 的 项 ， 因 此 i32 就 是 Iten 的 类 型 。 如 果 和 迭代 完成 ， 那 么 next 返 
回 None; 否则 ， 产 生 下 一 个 值 并 更 新 状态 以 备 下 次 调用 。 

当然 ，for 循环 要 使 用 IntoIterator::into_iter 将 其 操作 数 转换 为 一 个 迭代 器 。 但 标准 库 
为 每 个 实现 Iterator 的 类 型 都 提供 了 对 IntoIterator 的 通用 实现 ， 因 此 I32Range 已 经 可 
以 使 用 了 : 















































Let mut pi = 0.0; 
let mut numerator = 1.0; 


for k in (I32Range { start: 0，end: 14 }) { 
pi += numerator / (2*k + 1) as f64; 
numerator /= -3.0; 


pi *= f64::sqrt(12.0); 


// IEEE 754 明 确定 义 了 这 个 结果 
assert eq!(pi as f32, std::f32::consts::PI); 


不 过 I32Range 有 点 特殊 ， 它 的 可 返 代 类 型 和 迭代 器 都 是 同一 种 类 型 。 很 多 情况 并 没有 那么 


简单 。 例 如 ， 下 面 是 第 10 章 出 现 过 的 二 又 树 类 型 : 


enum BinaryTree<T> { 
Empty， 
NonEmpty(Box<TreeNode<T>>) 





} 


struct TreeNode<T> { 
element: T， 
left: BinaryTree<T>, 
right: BinaryTree<T> 


} 


遍历 二 又 树 的 经 典 方式 是 递归 ， 通 过 函数 调用 栈 跟踪 树 中 的 位 置 和 还 未 访问 的 节点 。 但 在 为 
BinaryTree<T> 实现 Iterator 时 ， 每 次 调用 next 必须 实际 产生 并 返回 一 个 值 。 为 跟踪 还 未 产 
生 的 树 节 点 ， 返 代 器 必须 维护 自己 的 栈 。 下 面 是 针对 BinaryTree 的 一 个 可 能 的 迭代 器 类 型 : 





use self::BinaryTree::*; 


// BinaryTree 的 按 序 遍历 状态 
struct TreeIter<'a，T: 'a> { 








// 树 节 点 引用 的 栈 。 因为 使 用 的 是 Vec 的 push 和 pop 方 法 ， 














// 所 以 栈 顶 是 向 量 的 末尾 
// 


// 节点 迭代 器 将 从 栈 顶 取得 下 一 个 值 ， 未 访问 的 祖先 节点 在 下 面 。 





// 如 果 栈 空 了 ， 则 迭代 结束 
unvisited: Vec<&'a TreeNode<T>> 


} 








常见 的 操作 是 先 将 子 树 左边 的 节点 推 到 栈 里 ， 为 此 ， 在 TreeIter 上 定义 这 么 一 个 方法 : 





impl<'a, T: 'a> TreeIter<'a，T> { 


fn push_left_ edge(&mut self, mut tree: &'a BinaryTree<T>) { 


while let NonEmpty(ref node) = *tree { 
self.unvisited.push(node); 
tree = &node. left; 


} 


有 了 这 个 辅助 方法 ， 可 以 再 为 BinaryTree 定义 一 个 iter 方法 ， 返 回 树 的 帮 代 器 ; 
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impL<T> BinaryTree<T> { 
fn iter(&self) -> TreeIter<T> { 
Let mut iter = TreeIter { unvisited: Vec::new() }; 
iter.push_left_edge(self); 
iter 


} 


文 个 iter 方法 构建 了 一 个 空 TreeIter， 然 后 调用 push_left_edge 来 填充 初始 的 栈 。 按 时 
unvisited 栈 的 规则 ， 最 左边 的 节点 在 上 面 。 


按照 标准 库 的 通行 做 法 ， 接 下 来 可 以 在 树 的 一 个 共享 引用 上 实现 IntoIterator， 调 用 
BinaryTree: :iter 返回 迭代 器 


滨 


impl<'a, T: 'a> IntoIterator for &'a BinaryTree<T> { 
type Item = &'aT; 
type IntoIter = Treelter<'a, T>; 
fn into iter(self) -> Self::IntoIter { 
self.iter() 
} 


} 
这 个 IntoIter 定义 将 TreeIter 作为 &BinaryTree 的 运 代 器 类 型 。 


最 后 ， 在 Iterator 的 实现 中 ， 要 实际 地 遍历 树 。 与 BinaryTree 的 iter 方法 类 似 ， 和 迭代 器 
的 next 方法 同样 按照 栈 的 规则 行事 : 


impl<'a, T> Iterator for Treelter<'a, T> { 
type Item = &'aT; 
fn next(&mut self) -> Option<&'a T> { 
// 查找 进 代 必须 产生 的 节点 ， 或 者 结束 迭 代 
Let node = match self. unvisited. pop() { 
None => return None, 
Some(n) => n 








站 











外 


// 当前 节点 后 面 的 下 一 个 节点 是 当前 节点 右 子 节点 的 最 左 子 节点 ， 
// 因此 把 它 推进 栈 里 
self.push_left_edge(&node.right); 


// 产生 对 节点 值 的 引用 


Some(&node.element) 














} 


如 果 栈 空 了 ， 结束 。 否 则 ，node 就 是 对 当前 节点 的 引用 ， 而 调用 会 返回 对 其 

a 全: we 
树 ， 那 么 要 访问 的 下 一 个 节点 就 是 这 个 子 树 的 最 左 节 点 。 如 果 这 个 节 点 没有 右 子 树 ，push_ 
left_edge 则 没有 效果 ， 这 也 是 我 们 想 要 的 : 可 以 认为 新 的 栈 顶 节 二 是 ho 的 全 一 个 未 访 
间 的 祖先 (如果 有 的 话 )。 


有 了 IntoIterator 和 Iterator 实现 ， 就 可 以 使 用 for 循环 按 引 用 友 代 BinaryTree 了 : 


fn make_node<T>(Left: BinaryTree<T>, element: T, right: BinaryTree<T>) 
-> BinaryTree<T> 
























































NonEmpty(Box: :new(TreeNode { left, element, right })) 


// 构建 一 棵 小 树 

let subtree \l = make node(Empty, "mecha", Empty); 

Let subtree rl = make node(Empty, "droid", Empty); 

Let subtree _r = make_node(subtree _ rl, "robot", Empty); 
let tree = make_node(subtree 1l, "Jaeger", subtree_r); 


// 迭代 树 

Let mut v = Vec::new(); 

for kind in &tree { 
v.push(*kind); 


assert eq!(v, ["mecha", "Jaeger", "droid", "robot"]); 


图 15-1 展示 了 在 和 迭代 示例 中 的 树 时 unvisited 栈 的 行为 。 在 每 一 步 中 ， 要 访问 的 下 一 个 市 
点 都 在 栈 顶 ， 而 其 未 访问 的 祖先 节点 都 在 下 面 。 











初始 的 unvisited 栈 准 备 产 生 准备 产生 准备 产生 最 终 的 栈 : ， 
栈 ， 准 备 产生 "Jaeger"。 然 后 "droid" "robot" 空 
"mecha' 把 右 子 树 的 左 
迭代 从 左 至 右 进行 








15-1: 迭代 二 叉 树 
所 有 和 常用 的 迭代 器 适配器 和 消费 者 都 可 以 在 这 个 树 上 使 用 : 


assert_eq!(tree.iter() 
.map(|name| format!("mega-{}", name)) 
.Collect: :<Vec<_>>()， 
vec!["mega-mecha", "mega-Jaeger", 
"mega-droid", "mega-robot"]); 
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我 们 都 像 考 克 斯 韦 妖 一 样 活动 。 生 物体 (organism)， 顾 名 思 义 ， 时 刻 在 组 织 
(organize)。 也 正 是 在 日 常 经 验 中 ， 我们 可 以 发 现 一 向 冷静 的 物理 学 家 之 所 以 会 
在 两 个 世纪 里 对 这 个 卡通 形象 一 直 难 以 忘怀 的 原因 。 我 们 分 拣 邮 件 、 扒 造 沙 堡 、 
拼凑 拼图 、 复 盘 棋 局 、 收 集邮 票 、 给 麦 穗 脱粒 、 按 字母 表 顺 序 排列 图 书 、 创 造 对 
称 形式 、 创 作 十 四 行 诗 和 奏鸣曲 ， 以 及 整理 自己 的 房间 。 所 有 这 些 活动 并 不 需要 
巨大 的 能 量 ， 只 需 保 障 我 们 能 够 发 挥 智能 便 可 。 





James Gleick, 《信息 简 史 》” 


Rust 标准 库 包含 儿 个 集合 性 的 泛 型 类 型 ， 用 于 在 内 存 中 存储 数据 。 之 前 我 们 已 经 用 过 集合 
了 ， 比 如 Vec 和 HashMap。 本 章 将 详细 介绍 这 两 个 类 型 以 及 其 他 儿 个 标准 集合 的 方法 。 在 
此 之 前 ， 需 要 先 明确 一 下 Rust 集合 与 其 他 语言 中 集合 的 系统 性 差异 。 


首先 ， 转 移 和 借用 无 处 不 在 。Rust 使 用 转移 来 避免 深 复制 值 。 这 也 是 Vec<T>: :push(itenm) 
按 值 而 非 按 引 用 取得 参数 的 原因 。 这 样 值 就 转移 到 了 向 量 中 。 第 4 章 中 的 那些 图 展示 了 这 
个 过 程 。 把 Rust 字符 串 推 到 vec<String> 中 很 快 ， 因 为 Rust 不 必 复 制 字符 串 的 字符 数据 ， 
而 且 字 符 串 的 所 有 权 始 终 非常 明确 。 

其 次 ，Rust 没有 无 效 错误 ， 比 如 在 集合 中 保存 数据 指针 ， 而 在 集合 缩放 或 被 修改 之 后 出 现 
悬空 指针 。 无 效 错误 是 C++ 中 另 一 个 未 定义 行为 的 来 产 。 即 使 在 内 存 安全 的 语言 中 ， 无 效 
错误 偶尔 也 会 导致 ConcurrentModificationException。Rust 借用 检查 器 在 编译 时 就 可 以 排 





除 这 些 问 题 。 




















最 后 ，Rust 没有 nutL， 因 此 在 其 他 语言 会 出 现 nutt 的 地 方 Rust 用 0ption 代替 。 























注 1: 此 书 已 由 人 民 邮 电 出 版 社 出 
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,i 











见 http:Wituring.cn/book/731 。 编者 注 


除了 以 上 差异 ，Rust 集合 跟 你 想象 中 的 应 该 都 一 样 。 有 经 验 的 程序 员 可 以 直接 跳 到 


16.6.1 市 。 


16.1 概述 





表 16-1 展示 了 Rust 的 8 个 标准 集合 ， 它 们 全 部 都 是 泛 型 类 型 。 


表 16-1: 标准 集合 











oe py 其 他 语言 中 类 似 的 集合 
集 [= 说 明 
C++ Java Python 

Vec<T> 可 增 数组 vector ArrayList list 
VecDeque<T> 双 端 队列 deque ArrayDeque COLLections 

(可 增长 环形 缓冲 区 ) .deque 
LinkedList<T> 双向 链表 list LinkedList = 
BinaryHeap<T> 最 大 堆 priority_queue PriorityQueue heapq 
where T: Ord 
HashMap<K, V> 键 - 值 散 列 表 unordered_map HashMap dict 
where K: Eq + Hash 
BTreeMap<K, V> 有 序 键 - 值 表 map TreeMap = 
where K: Ord 
HashSet<T> 散 列 表 unordered_set Hashset set 
where T: Eq + Hash 
BTreeSet<T> 有 序 集 Set TreeSet = 


where T: Ord 


Vec<T>、HashMap<K，V> 和 Hashset<T> 是 最 常用 的 集合 类 型 ， 


逐一 讨论 这 些 集合 。 


其 他 类 型 用 处 有 限 。 本 章 将 


。 Vec<T> 是 可 增长 的 、 分 配 在 堆 上 的 类 型 的 值 的 数组 。 本 章 会 用 近 一 半 篇 幅 介 绍 Vec 及 














其 有 用 的 方法 。 


。 VecDeque<T> 与 Vec<T> 类 似 ， a 合作 为 先进 先 出 队列 使 用 。 它 支持 在 列表 前 端 和 后 端 


高 效 地 添加 和 移 除 值 。 但 这 样 会 导致 其 他 所 有 操作 稍微 变 慢 





。 LinkedList<T> 支持 在 列表 前 、 后 百 端 快速 存 取 ， 


。 BinaryHeap<T> 是 一 个 优先 队列 。BinaryHeap 中 值 

















些 


o 


与 VecDeque<T> 类 似 , 但 增加 了 快速 连接 。 
不 过 ， 通 常 来 说 ，LinkedList<T> 还 是 比 Vec<T> 和 VecDeque<T> 慢 一 些 。 














直 的 组 织 方式 始终 适合 查找 和 移 除 最 大 值 。 


。 HashMap<K，V> 是 一 个 键 - 值 对 的 表 ， 按 键 查 值 很 快 。 条 目 以 任意 顺序 存储 。 

。 BTreeMap<K，V> 与 HashMap<K，V> 类 似 ， 但 条 目 以 键 的 顺序 存储 。 比 如 ，BTreeMap <String， 
i32> 按 字符 串 比 较 顺 序 存 储 其 条 目 。 除 非 需要 按 序 存储 条 目 ,否则 用 HashMap<K,，V> 更 快 。 

。 Hashset<T> 是 一 组 类 型 T 的 值 ， 添 加 和 移 除 值 很 快 ， 检 查 给 定 值 是 否 在 集合 中 存在 也 


很 快 。 
。 BTreeSet<T> 与 Hashset<T> 类 似 , 但 值 是 按 顺 
否则 用 HashSet<T> 更 快 。 


序 存储 的 。 同 档 





EF， 除非 需要 保证 数据 的 顺序 





16.2 Vec<T> 
之 前 已 经 多 次 用 到 过 vec， 所 以 假设 大 家 对 它 已 经 熟悉 了 。 不 熟悉 的 可 以 参考 3.4.2 节 。 接 
下 来 我 们 会 深入 介绍 它 的 方法 和 内 部 工作 原理 。 
创建 向 量 最 简单 的 方式 是 使 用 vec! 宏 : 
// 创建 空间 量 


Let mut numbers: Vec<i32> = vec![]; 








// 创建 包含 给 定 内 容 的 向 量 

Let words = vec!["step", "on", "no", "pets"]; 

Let mut buffer = vec![0u8; 1024]; // 1024 个 填充 0 的 字 节 
第 4 章 介绍 过 ， 向 量 有 3 个 字段 : 长 度 、 容 量 和 指向 存储 其 元 素 的 堆 内 存 的 指针 。 图 16-1 
形象 地 展示 了 前 面 代 码 创 建 的 向 量 在 内 存 中 的 布局 。 空 向 量 numbers 的 初始 容量 为 0。 在 
为 它 添加 第 一 个 元 素 之 前 ， 不 会 分 配 堆 内 存 。 











numbers Words buffer 














16-1: 向 量 的 内 存 布 局 。words 的 每 个 元 素 都 是 一 个 包含 指针 和 长 度 的 &str 值 
与 所 有 和 集合 一 样 ，Vec 实现 了 std::iter::FromIterator。 因 此 可 以 使 用 友 代 器 的 .coLLect() 
方法 基于 任何 运 代 器 创建 向 量 ，15.4.12 市 已 经 介绍 过 了 : 

// 把 另 一 个 集合 转换 为 向 量 


Let my_vec = my_set.into iter().collect::<Vec<String>>(); 





16.2.1 访问 元 素 
通过 索引 可 以 直观 地 获取 数组 、 切 片 或 向 量 的 元 素 : 
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// 取得 一 个 元 素 的 引用 
Let first line = &lines[0]; 














// 取得 一 个 元 素 的 副本 
Let fifth_number = numbers[4]; // 要 求 Copy 
Let second_ line = lines[1].clone(); // 要 求 CLone 





// 取得 一 个 切片 的 引用 
Let my_ref = &buffer[4..12]; 











// 取得 一 个 切片 的 副本 
Let my_copy = buffer[4..12].to_vec(); // 要 求 CLone 


如 果 索 引 越界 ， 则 所 有 这 些 形式 都 会 许 异 。 


Rust 对 数值 类 型 很 挑剔 ， 对 向 量 也 不 例外 。 向 量 长 度 和 索引 是 usize 类 型 。 使 用 u32、u64 
或 isize 作为 向 量 索 引 会 出 错 。 必 要 时 可 以 使 用 n as usize 来 转换 ， 参 见 6.13 市 。 


以 下 这 些 方法 可 以 方便 地 访问 向 量 或 切片 的 特定 元 素 注意， 所 有 切片 方法 也 可 以 在 数组 
和 向 量 上 使 用 )。 


。 slice.first() 返回 对 slice 第 一 个 元 素 的 引用 (如 果 有 的 话 )。 


返回 值 类 型 是 0ption<&T>， 因 此 如 果 slice 为 空 则 返回 值 是 None， 如 果 不 为 空 则 返 
Some(&sLice[0])。 






































if let Some(item) = v.first() { 
println!("We got one! {}", item); 


} 


。 slice.last() 与 slice.first() 类 似 ， 只 是 返回 最 后 一 个 元 素 的 引用 。 
。 slice.get(index) 返回 slice[index] 的 Some 引用 (如 果 它 存在 的 话 ) ， 或 者 如 果 slice 
的 元 素 少 于 index+1 个 则 返回 None。 
let slice = [0, 1, 2, 3]; 


assert_eq!(slice.get(2), Some(&2)); 
assert_eq!(slice.get(4), None); 





























。 slice.first_mut()、 slice.last_mut() 和 slice.get_mut(index) 是 上 面 几 个 方法 的 变 体 ， 
返回 mut 引用 。 


Let mut slice = [0, 1, 2, 3]; 

{ 
Let last = slice.last_mut().unwrap(); // Last 的 类 型 是 &mut i32 
assert_eq!(*Last，3); 
*last = 100; 





} 
assert eq!(slice, [0, 1, 2, 100]); 


因为 返回 T 值 意味 着 转移 ， 所 以 就 地 访问 元 素 的 方法 通常 都 返回 元 素 的 引用 。 
一 个 例外 是 .to_vec() 方法 ， 它 返回 元 素 的 副本 。 
。 slice.to_vec() 克隆 整个 切片 ， 返 回 一 个 新 向 量 。 


已 
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let v= [1, 2, 3 


，4, 5, 6, 7, 8, 9]; 


assert_ eq!(v.to_vec(), 


vec![ 
assert_eq!(v[0.. 
vec![ 


这 个 方法 只 在 元 素 


16.2.2 和 迭代 


1; 2 38 91)5 
6].to_vec() ， 
5 


是 可 以 克隆 (where T: Clone) 的 情况 下 有 效 。 


向 量 和 切片 是 可 以 迭代 的 ， 遵 循 15.2.2 贡 的 模式 ， 既 可 以 按 值 欠 代 ， 也 可 以 按 引 用 返 代 。 


友 代 Vec<T> 产生 TT 
友人 代 &[T; N]、&[T 
的 项 ， 即 对 个 别 元 
迭 代 &mut [T; N]、 


类 型 的 项 。 元 素 逐 个 从 向 量 中 转移 出 来 并 被 消费 。 

] 或 &vec<T> 类 型 的 值 ， 即 对 数组 、 切 片 或 向 量 的 引用 ， 产 生 &T 类 型 
素 的 引用 ， 不 会 转移 。 

&mut [T] 或 &mut Vec<T> 类 型 的 值 产生 &mut T 类 型 的 项 。 





数组 、 切 片 和 向 量 还 有 .iter() 和 .iter_mut() 方法 (参见 15.2.1 节 )， 这 两 个 方法 创建 的 
迭代 器 产生 对 它们 元 素 的 引用 。16.2.5 节 还 会 介绍 迭代 切片 的 更 新 奇 方 式 。 


16.2.3 ”增长 和 收缩 问 量 
数组 、 切 片 和 向 量 的 长 度 表示 它们 包含 元 素 的 数量 。 

slice.len() 返回 slice 的 长 度 ， 类 型 为 usize。 

slice.is_empty() 在 slice 不 包含 元 素 ( 即 slice.len() == 0) 时 返回 true。 
本 节 的 其 他 方法 涉及 增 大 和 收缩 向 量 。 数 组 和 切片 的 大 小 是 不 可 变 的 ， 因 此 没有 这 些 方法 。 
向 量 的 所 有 元 素 都 存储 在 分 配 在 堆 的 连续 内 存 块 中 。 疝 量 的 容量 是 这 个 块 中 可 以 容纳 的 最 
大 元 素数 量 。Vec 通常 自动 管理 容量 ， 在 需要 更 多 容量 时 会 分 配 更 大 的 缓冲 区 并 把 元 素 转 
移 过 去 。 不 过 也 有 一 些 显 式 管理 容量 的 方法 。 


























。 Vec: :with_capacity(n) 创建 容量 为 地 的 新 的 空 向 量 。 


。 vec.capacity() 返 
。 vec.reserve(n) 确 
少 等 于 vec. len() 


的 缓冲 区 ， 然 后 把 









































日 .EE 


回 vec 的 容量 ,类 型 为 usize。vec.capacity() >= vec.len() 是 肯定 的 。 
呆 疝 量 有 足够 空间 容纳 另外 个 元 素 。 换 句 话 说 ，vec.capacity() 至 
+ n。 如 果 容 量 已 经 够 了 ， 则 什么 也 不 做 。 否 则 ， 就 会 分 配 一 个 更 大 
向 量 内 容 转 移 过 去 。 





。 vec.reserve_exact(n) 与 vec.reserve(n) 类 似 ， 但 告诉 vec 分 配 的 空间 不 能 超过 n， 不 


考虑 未 来 的 增长 。 


如 果 vec.capacity 

















之 后 ，vec.capacity() 等 于 vec.Len() + n。 
() 大 于 vec.len()，vec.shrink_to_fit() 则 尝试 释放 额外 的 内 存 。 





Vec<T> 有 很 多 添加 和 移 除 元 素 的 方法 ， 它 们 可 以 改变 向 量 的 长 度 。 这 些 方法 都 以 向 量 的 可 
修改 (mut) self 引用 为 参数 。 


下 面 两 个 方法 在 向 量 末尾 添加 或 移 除 一 个 值 。 
。 vec.push(value) 在 vec 末尾 添加 给 定 的 vaLue。 








。 vec.pop() 移 除 并 返回 最 后 一 个 元 素 。 返 回 值 的 类 型 是 0ption<T>。 如 果 最 后 一 个 元 素 是 
x 则 返回 Some(x) ， 如 有 果 向 量 为 空 则 返回 None。 


注意 ，.push() 取得 参数 的 值 ， 而 不 是 引用 。 类 似 地 ，.pop() 也 返回 元 素 的 值 而 非 引 用 。 
本 节 剩 下 的 多 数 方法 也 是 如 此 。 它 们 可 以 给 向 量 添加 值 或 者 从 向 量 中 移 除 值 。 


下 面 两 个 方法 在 向 量 的 任何 地 方 添加 或 移 除 值 。 


。 vec.insert(index，value) 在 vec[index] 中 插入 value,， 将 vec[index..] 中 的 值 向 右 顺 
移 一 个 位 置 。 
如 果 index > vec.len() 则 许 异 。 

。 vec.remove(index) 移 除 并 返回 vec[index], 将 vec[index+1..] 中 的 值 向 左 顺 移 一 个 位 置 。 
如 果 index >= vec.len() 则 诈 异 ， 因 为 此 时 vec[index] 没有 要 移 除 的 元 素 。 
向 量 越 长 ， 这 个 操作 越 慢 。 如 果 经 常 需要 vec.remove(9)， 可 以 使 用 vecDeque (参见 
16.3 节 ) 而 不 是 Vec。 


要 移动 的 元 素 越 多 ，.insert() 和 .remove() 的 速度 越 慢 。 
下 面 3 个 方法 可 以 将 向 量 的 长 度 修改 为 指定 的 值 。 


。 vec.resize(new_len，value) 将 向 量 长 度 设置 为 new_len。 如 果 这 样 vec 的 长 度 会 增长 ， 
则 将 vatLue 的 副本 放 到 新 位 置 。 元 素 的 类 型 必须 实现 Clone 特 型 。 

。 vec.truncate(new_len) 将 向 量 长 度 减少 为 new_len， 清 除 范 围 在 vec[new_len..] 之 内 的 
元 素 。 
如 果 vec.tLen() 小 于 或 等 于 new_len， 则 什么 也 不 会 发 生 。 

。 vec.clear() 从 vec 中 移 除 所 有 元 素 。 相 当 于 vec.truncate(0) 。 

以 下 4 个 方法 可 以 一 次 添加 或 移 除 多 个 值 。 

。 vec.extend(iterable) 按 顺 序 将 iterable 的 所 有 项 添加 到 vec 末尾 。 类 似 于 给 .push() 
传 入 多 个 值 。iterable 参数 可 以 是 实现 IntoIterator<Item=T> 的 任何 值 。 
这 个 方法 非常 有 用 ， 因 此 它 有 一 个 专门 的 标准 特 型 Extend， 所 有 标准 集合 都 实现 了 。 
然而 ， 这 也 导致 在 rustdoc 生成 的 HTML 中 把 .extend() 和 其 他 特 型 方法 都 混在 了 一 


起 ， 挤 到 了 页 面 底部 ， 因 此 在 需要 的 时 候 很 难 找到 它 。 只 要 记 住 它 就 在 那里 就 行 了 。 更 
多 信息 参见 15.4.13 节 。 










































































。 vec.split_off(index) 与 vec.truncate(index) 类 似 ， 只 不 过 它 会 返回 一 个 包含 从 vec 
末尾 移 除 值 的 Vec<T >。 这 就 类 似 多 值 版 的 .pop()。 

。 vec.append(&mut vec2) 把 vec2 的 所 有 元 素 转移 到 vec， 之 后 vec2 变 空 。vec2 也 是 类 型 
为 Vec<T> 的 向 量 。 
与 vec.extend(vec2) 类 似 ， 只 不 过 vecz2 在 操作 之 后 还 存在 ， 容 量 不 会 受 影响 。 

。 vec.drain(range) 从 vec 中 移 除 范围 vec[range]， 返 回 被 移 除 元 素 的 迭代 器 。range 是 
一 个 范围 值 ， 类 似 .. 或 0..4。 


还 有 几 个 奇怪 的 方法 ， 可 以 从 向 量 中 选择 性 地 移 除 元 素 。 








。 vec.retain(test) 移 除 所 有 没有 通过 给 定 测试 的 元 素 。test 参数 是 一 个 实现 FnMut(&T) 
-> bool 的 国 数 或 困 包 。 对 vec 的 每 个 元 素 ， 都 会 调用 test(&element)， 如 果 返 回 
false， 则 从 向 量 中 移 除 element 并 清除 。 
不 考虑 性 能 ， 就 类 似 于 如 下 代码 : 


vec = vec.into iter().filter(test).collect(); 


。 vec.dedup() 清除 重复 的 元 素 。 类 似 于 Unix 的 uniq 终端 命令 。 这 个 方法 会 扫描 vec， 对 

比 相 邻 的 元 素 ， 如 果 发 现 相 等 则 清除 额外 相等 的 值 ， 只 只 留 下 一 个 

let mut byte vec = b"Misssssssissippi".to vec(); 

byte_vec.dedup(); 

assert_eq!(&byte vec, b"Misisipi"); 
注意 ， 结 果 中 仍然 有 两 个 's'。 这 个 方法 只 移 除 连续 的 重复 值 。 要 去 掉 所 有 重复 的 值 ， 
有 3 个 办 法 。 一 是 调用 .dedup() 之 前 先 把 向 量 排序 ， 二 是 把 数据 转移 到 集中 ， 三 是 使 
用 (可 以 保持 元 素 原始 顺序 的 ) .retain() 技巧 : 


Let mut byte vec = b"Misssssssissippi".to vec(); 



























































let mut seen = HashSet::new(); 
byte vec.retain(|r| seen.insert(*r)); 


assert eq!(&byte vec, b"Misp"); 
这 之 所 以 可 行 ， 是 因为 .insert() 在 集中 已 经 包含 要 插入 项 时 返回 false。 


。 vec.dedup_by(same) 与 vec.dedup() 类 似 ， 只 不 过 它 使 用 函数 或 闭 包 same(&mut etLem1， 
&mut elem2) 而 不 是 == 操作 符 判 断 两 个 元 素 是 不 是 重复 。 
。 vec.dedup_by_key(key) 与 vec.dedup() 类 似 ， 只 不 过 判断 两 个 元 素 重 复 的 依据 是 
key(&mut elem1) == key(&mut etLem2) 。 
例如 ， 如 果 error 是 一 个 Vec<Box<Error>>， 可 以 这 样 写 : 
// 移 除 消息 内 容重 复 的 错误 
errors.dedup_by_key(|err| err.description().to_string()); 
本 市 介绍 的 所 有 方法 中 只 有 .resize() 会 克隆 值 。 其 他 方法 都 是 把 值 从 一 个 地 方 转移 到 另 
一 个 地 方 。 














16.2.4 连接 

以 下 两 个 方法 适用 于 数组 的 数组 ， 包 括 任何 数组 、 切 片 或 向 量 ， 甚 元素 本 身 也 是 数组 、 切 
片 或 向 量 。 

。 slices.concat() 返回 拼接 所 有 切片 得 到 的 新 向 量 。 


assert_eq!([[1，2]，[3，4]，[5，6]].concat()， 
vecl[l1, 2; 3 4, 5; 61); 


。 slices.join(&separator) 与 slices.concat() 类 似 ， 只 不 过 会 把 separator 的 副本 插 到 
切片 之 间 : 
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assert_eq!([[1, 2], [3, 4], [5, 6]].join(&0), 
vec![1, 2, 0, 3, 4, 0, 5, 6]); 


16.2.5 ” 拆 分 
同时 取得 多 个 不 可 修改 引用 的 数组 、 切 片 或 向 量 很 容易 : 


let v = vec![0, 1, 2, 3]; 
let a = &v[il]; 
let b = &v[j]; 


Let mid = v.len() / 2; 

let front_half = &v[..mid]; 

Let back_half = &v[mid..]; 
但 取得 多 个 可 修改 引用 就 不 容易 了 : 


Let mut v = vec![0, 1, 2, 3]; 
let a = &mut v[i]; 
let b = &mut v[j]; // error: cannot borrow ‘v. as mutable 
// more than once at a time 
Rust 禁止 这 样 操作 ， 因 为 如 果 i == j， 那 么 a 和 b 就 都 是 对 同一 个 整数 的 可 修改 引用 ， 这 
违反 了 Rust 的 安全 规则 。( 参 见 5.3 节 。) 
Rust 有 可 以 同时 将 多 个 可 修改 引用 借用 为 两 个 或 多 个 数组 、 切 片 或 癌 量 的 方法 。 与 上 面 的 
代码 不 同 ， 这 些 方 法 是 安全 的 ， 因 为 它们 从 设计 上 就 保证 了 把 数据 拆 分 为 不 重 又 的 区 块 ， 
其 中 有 许多 方法 还 适用 于 不 可 修改 的 切片 ， 因 此 就 有 了 mut 和 非 mut 两 个 版 本 。 
16-2 展示 了 这 些 方法 。 这 些 方法 都 不 直接 修改 数组 、 切 片 或 向 量 ， 它 们 仅仅 返回 对 其 中 
部 分 数据 的 新 引用 。 
。 slice.iter() 和 slice.iter_mut() 返回 的 迭代 器 产生 sLice 中 每 个 元 素 的 引用 。16.2.2 
节 介 绍 过 它们 。 
。 slice.split_at(index) 和 slice.split_at_mut(index) 将 切片 一 分 为 二 ， 返 回 包含 两 个 
部 分 的 元 组 。slice.split_at(index) 等 价 于 (&slice[..index]，&slice[index..])。 如 
果 index 越界 ， 这 两 个 方法 会 证 异 。 
。 slice.split_first() 和 slice.split_first_mut() 也 返回 元 组 ， 包 含 对 第 一 个 元 素 的 引 
用 (〈sLice[9]) 和 对 所 有 剩余 元 素 切 片 的 引用 (slice[1..])。 


.split_first() 返回 值 的 类 型 是 0ption<(&T，&[T])>， 如 果 切 片 为 空 则 返回 None。 

。 slice.split_last() 和 sLice.spLit_Last_mut() 类 似 ， 但 以 最 后 一 个 而 不 是 第 一 个 元 素 
为 分 隔 符 。 
.Split_last() 返回 值 的 类 型 是 Option<(&[T]，&T)>。 


。 slice.split(is_sep) 和 slice.split_mut(is_sep) 基于 国 数 或 闭 包 is_sep 将 slice 拆 分 
为 一 个 或 多 个 子 切 片 ， 返 回 子 切片 的 友 代 器 。 


在 消费 返回 的 迭代 器 时 ， 它 会 对 切片 中 的 每 个 元 素 调 用 is_sep(&element)。 如 果 














































































































is_sep(&element) 返回 true， 则 这 个 元 素 就 是 分 隔 符 。 分 隔 符 元 素 不 包含 在 输出 的 任何 


子 切片 中 。 





输出 始终 包含 至 少 一 个 子 切 片 ， 多 一 个 分 隔 符 元 素 就 多 一 个 子 切 片 。 如 有 果 多 个 分 隔 符 相 


邻 或 者 分 隔 符 是 sLice 的 最 后 一 个 元 素 ， 则 输 





会 包含 空子 切片 。 


。 slice.splitn(n，is_sep) 和 slice.splitn_mut(n，is_sep) 类 似 ， 但 最 多 只 产生 n 个子 


切片 。 在 找到 前 mn-l 个 切片 后 ， 就 不 会 再 调 月 





元 素 。 





日 is_sep。 最 后 一 个 子 切片 包含 所 有 剩余 


。 Sslice.rsplitn(n, is_sep) 和 slice.rsplitn_mut(n, is_sep) 与 .splitn() 和 .splitn_ 
mut() 类 似 ， 只 是 反 向 扫描 切片 。 换 名 话说 ， 这 两 个 方法 会 基于 切片 中 的 后 (而 不 是 前 ) 
nn-1 个 分 隔 符 拆 分 ， 因 此 会 从 末尾 开始 产生 子 切 片 。 

。 slice.chunks(n) 和 slice.chunks_mut(n) 返回 迭代 器 ， 产 生长 度 为 n 的 韭 重叠 子 切 片 。 
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有 果 slice.len() 不 是 的 倍数 ， 则 最 后 一 个 子 切片 长 度 小 于 n。 





slice.split_at(4) 
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slice.split(|8x| x==0) ms [| | 
slice.splitn(2, |&x| x==0) mm | 
slice.rsplitn(2, |&X| x==0) mm I 
Slice.chunks(2) -mms rs Es es 
slice.windows(4) 











图 16-2; 拆 分 方法 示意 图 。stice.spLit() 输出 中 的 小 短 形 是 一 个 空 切 片 ， 因 为 两 个 分 隔 符 相 邻 。 另 


外 ，rsplitn 是 从 后 向 前 产生 输出 ， 与 其 他 方法 不 同 


还 有 一 个 迭代 子 切片 的 方法 。 


。 slice.windows(n) 返回 的 迭代 器 类 似 于 stice 数据 的 “滑动 窗口 "。 这 个 迭代 器 产生 包 
含 stlice 中 个 连续 元 素 的 子 切片 。 比 如 ， 产 生 的 第 一 个 子 切片 是 &8stice[9..n]， 第 二 








个 子 切片 是 &stlice[1..n+1]， 以 此 类 推 。 


如 果 n 大 于 slice 的 长 度 ， 则 不 会 产生 切片 。 如 果 n 是 0， 则 这 个 方法 会 证 异 。 
例如 ， 如 果 days.Len() == 31， 那 么 调用 days.windows(7) 会 产生 days 中 所 有 连续 7 天 


的 子 切片 。 





大 小 为 2 的 滑动 窗口 可 用 于 检测 数据 序列 中 两 个 数据 点 的 变化 : 





Let changes = daily_high temperatures 
.windows(2) // 取得 相 邻 两 天 的 温度 
.map(|w| w[1] - w[0]) // 温差 有 多 大 ? 


.Collect::<Vec<_ >>(); 


因为 子 切片 是 重 辣 的 ， 所 以 这 个 方法 没有 返回 mut 引用 的 变 体 。 


16.2.6 ”交换 
交换 两 个 元 素 也 有 相应 的 方法 。 


slice.swap(ii，j) 会 交换 slice[i] 和 slice[j] 这 两 个 元 素 。 





向 量 还 支持 一 个 相对 方法 ， 此 方法 可 以 高 效 移 除 任意 元 素 。 














vec.swap_remove(i) 移 除 并 返回 vec[i]， 跟 vec.remove(i) 类 似 ， 但 不 会 把 后 面 的 元 素 
向 前 移动 以 填补 空缺 ， 而 是 简单 地 把 vec 的 最 后 一 个 元 素 移 到 空位 上 。 在 不 关心 向 量 剩 
余 元 素 顺 序 的 情况 下 可 以 使 用 。 








16.2.7 ”排序 和 搜索 
切片 提供 了 3 个 排序 方法 。 


slice.sort() 会 对 元 素 递增 排序 。 这 个 方法 只 在 元 素 类 型 实现 ord 的 情况 下 才 存 在 。 
slice.sort_by(cmp) 使 用 指定 排序 ea 数 或 闭 包 cmp 对 slice 的 元 素 进 行 排序 。 
必须 实现 Fn(&T，&T) -> std::cmp::0rdering。 

手工 实现 cmp 比较 麻烦 ， 可 以 委托 给 一 个 .cmp() 方法 : 


students.sort_by(|a, b| a.Last_name.cmp(&b.Last_name) ); 
如 果 想 按 某 字 段 排序 ， 用 另 一 个 字段 作为 最 终 依据 ， 则 要 比较 元 组 : 


students.sort_by(|a，b| { 
Let a key = (&a.last name, &a.first_name); 
Let b key = (&b.last name, &b.first_ name); 
a_key.cmp(&b_key) 

}); 


slice.sort_by_key(key) 会 按照 排序 键 对 slice 的 元 素 递 增 排序 ， 排 序 键 使 用 函数 或 闭 
包 key 给 出 。key 的 类 型 必须 实现 Fn(&T) -> K where K: Ord。 
在 T 包含 一 个 或 多 个 可 排序 字段 时 可 以 使 用 ， 可 以 选择 多 种 排序 方式 : 


// 按 年 级 平均 分 排序 ， 最 低 分 排 前 头 


students.sort_by_key(|s| s.grade point_average()); 
注意 ， 排 序 期 间 不 会 缓存 排序 键 的 值 ， 因 此 key 函数 可 能 会 被 调用 n 次 以 上 。 
由 于 技术 上 的 原因 ，key(element) 不 能 返回 从 元 素 借用 的 引用 。 这 样 不 行 : 
students.sort_by_key(|s| &s.last_name); // 错误 : 不 能 推断 生命 期 


Rust 无 法 确定 生命 期 。 但 在 这 种 情况 下 ， 直 接 使 用 .sort_by() 也 没 问 题 











以 上 3 个 方法 都 执行 稳定 排序 。 


要 反 向 排序 ， 可 以 使 用 sort_by 并 传人 两 次 参数 调换 了 次 序 的 cmp 闭 包 。 比 如 ，1b，al 而 
不 是 1a，bl 就 会 执行 反 向 排序 。 或 者 也 可 以 在 排序 之 后 调用 .reverse( ) 方法 。 


slice.reverse() 对 切片 元 素 就 地 反 向 排序 。 
切片 排序 完毕 后 ， 可 以 高 效 地 进行 搜索 。 


sLice.binary_search(&vaLue)、sLice.binary_search_by(&vaLue，cmp) 和 slice.binary_ 


search_by_key(&value，key) 都 可 以 从 排序 后 的 切片 中 搜索 vaLue。 注 意 vatue 传 的 是 引用 。 


这 几 个 方法 返回 的 类 型 是 Result<usize，usize>。 如 果 在 指定 的 排序 下 slice[index] 等 
于 value， 它 们 就 返回 ok(index)。 如 果 没 有 找到 这 个 索引 ， 它 们 则 返回 Err(insertion_ 
point)， 这 样 在 insertion_point 位 置 插入 value 会 保持 顺序 。 


当然 ， 二 分 查找 只 对 已 经 按 指定 方式 排 过 序 的 切片 有 有 用。 否则 结果 无 法 确定 ， 即 “垃圾 
进 ， 垃圾 出 ”。 
因为 f32 和 f64 有 NaN 值 ， 所 以 它们 都 未 能 实现 0rd， 也 不 能 直接 作为 键 用 于 排序 和 二 分 
查找 方法 。 要 对 浮 点 数据 使 用 类 似 的 方法 ， 可 以 选择 ord_subset 包 。 
还 有 一 个 搜索 未 排序 向 量 的 方法 。 
slice.contains(&value) 在 slice 的 任意 元 素 等 于 value 时 返回 true。 这 个 方法 逐个 检 
查 切片 的 元 素 看 是 否 匹配 。 同 样 ，vatLue 传 的 是 引用 。 


要 查找 值 在 切片 中 的 位 置 ， 类 似 JavaScript 中 的 array.index0f(vaLue)， 可 以 使 用 友 代 器 : 


slice.iter().position(|x| *x == value) 























返回 的 是 一 个 0ption<usize>。 


16.2.8 比较 切片 
如 果 类 型 T 支 持 == 和 != 操作 符 (PartiaLEq 特 型 ， 参 见 12.2 节 )， 那 么 数组 [T; N]、 切 片 
[T] 和 向 量 Vec<T> 也 支持 它们 。 如 果 切 片 的 长 度 相 等 ， 对 应 的 每 个 元 素 也 相等 ， 那 它们 就 
相等 。 数 组 和 向 量 也 是 如 此 。 
如 果 T 支 持 <、<=、> 和 >= 操作 符 (Partialord 特 型 ， 参 见 12.3 节 )， 那 么 T 的 数组 、 切 
片 和 癌 量 也 支持 。 切 片 比较 是 按 词典 顺序 进行 的 。 
以 下 是 两 个 常用 的 切片 比较 方法 。 
slice.starts_with(other) 在 slice 开头 的 一 系列 值 等 于 另 一 个 切片 other 的 元 素 时 会 
返回 true。 























assert_eq!([1，2，3，4].starts_with(&[1，2])，true); 
assert_eq!([1，2，3，4].starts_with(&[2，3])，faLse); 


slice.ends_with(other) 类 似 ， 但 比较 的 是 sLice 的 末尾 。 
assert eq!([1, 2, 3, 4].ends_with(&[3, 4]), true); 





16.2.9 ”随机 元 素 

随机 数 并 没有 内 置 在 Rust 标准 库 中 。rand 包 提 供 了 以 下 两 个 方法 ， 用 于 从 数组 、 切 片 或 
向 量 中 取得 随机 输出 。 
。 rng.choose(slice) 返回 对 slice 中 随机 元 素 的 引用 。 与 slice.first() 和 slice.last() 

类 似 ， 这 个 方法 也 返回 0ption<&T>， 只 有 在 切片 为 空 时 会 返回 None。 

。 rng.shuffle(slice) 对 slice 元 素 就 地 随机 排序 。 必 须 传 入 slice 的 可 修改 (mut) 引用 。 
这 两 个 是 rand: :Rng 特 型 的 方法 ， 因 此 调用 它们 需要 一 个 Rng 〈 随 机 数 生 成 器 ) 。 不 过 ， 通 
过 调用 rand: :thread_rng() 可 以 方便 地 取得 它 。 要 打 乱 my_vec 的 顺序 ， 可 以 这 样 : 


use rand::{Rng, thread_rng}; 











thread_rng().shuffLe(&mut my_vec); 


16.2.10 ”Rust 排 除 无 效 错误 
大 多 数 主 流 编 程 语 言 支 持 集 合 和 迭代 器 ， 也 会 有 这 条 规则 : 不 要 在 迭代 集合 的 时 候 修改 
它 。 例 如 ，Python 中 与 向 量 对 应 的 是 列表 : 
my List a [1 35. 55 7 9 
假设 要 从 my_list 中 移 除 大 于 4 的 所 有 值 : 


for index, val in enumerate(my_list): 
if val > 4: 
del my_list[index] # bug: 友人 代 过 程 中 修改 列表 








print(my_list) 
(Python 的 enumerate 函数 对 应 Rust 的 .enumerate() 方法 ， 参 见 15.3.11 节 ,) 


这 个 程序 会 令 人 吃惊 地 打印 [1，3，7]; 但 7 大 于 4。 它 是 怎么 漏网 的 呢 ? 这 是 因为 一 个 无 
效 错误 导致 的 : 程序 在 迭代 期 间 修改 数据 导致 了 迭代 器 无 效 。 在 Java 中 ， 这 会 导致 异常 ; 
在 C++ 中 ， 这 是 一 个 未 定义 行为 。 在 Python 中 ， 虽 然 这 个 行为 有 明确 定义 ， 但 不 直观 : 
友 代 器 跳 过 一 个 元 素 。 因 此 val 永远 不 会 等 于 7。 


下 面 我 们 在 Rust 中 复 现 这 个 bug: 


fn main() { 
Let mut my _vec = vec![1, 3, 5, 7, 9]; 
for (index, &val) in my_vec.iter().enumerate() { 
if val > 4 { 
my_vec.remove(index); // 错误 : 不 能 借用 my_vec 的 可 修改 引用 
} 














println!i("{:?}", my_vec); 
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不 可 修改 引用 的 情况 下 ， 不 能 调用 my_vec.remove(index) 修改 向 量 。 





自然 地 ，Rust 在 编译 时 就 拒绝 了 这 个 程序 。 在 调用 my_vec.iter() 时 ， 循 环 会 借用 向 量 的 
共享 (不 可 修改 ) 引用 。 这 个 引用 的 生命 期 与 迭代 器 一 样 长 ， 直 到 for 循环 结束 。 在 存在 





编译 时 报错 当然 很 好 ， 但 还 需要 想 办 法 达到 目的 。 修 复 这 个 问题 最 简单 的 方式 是 这 样 写 : 





my_vec.retain(|&val| val <= 4); 


或 者 在 Python 和 其 他 语言 中 ， 可 以 使 用 filter 创建 一 个 新 问 量 。 














16.3 VecDeque<T> 








Vec 只 支持 在 两 端 高 效 添加 和 移 除 元 素 。 如 果 程 序 需 要 把 值 保存 在 队列 中 间 ，Vec 就 慢 了 
Rust 的 std::collections::VecDeque<T> 是 一 个 deque (发 音 “deck”)， 即 双 端 队列 。 它 支 


持 前 端 和 后 端的 高 效 添 加 和 移 除 操作 。 
。 deque.push_front(value) 在 队列 前 面 添 加 值 。 





。 deque.push_back(value) 在 队列 后 面 添加 值 。( 这 个 方法 用 得 比 .push_front() 多 ， 因 为 








队列 习惯 上 都 在 后 面 添加 值 并 在 前 面 移 除 值 ， 就 像 人 们 排队 一 样 。) 























。 deque.pop_front() 移 除 并 返回 队列 前 面 的 值 ， 返 回 0ption<T>， 队 列 为 空 时 返回 None， 





跟 vec.pop() 一 样 。 
。 deque.pop_back() 移 除 并 返回 队列 后 面 的 值 ， 同 样 返 回 0ption<T>。 
。 deque.front() 和 deque.back() 与 vec.first() 和 vec.Last() 相似 ， 
端 元 素 的 引用 。 返 回 0ption<T>， 队 列 为 空 时 返回 None。 

















返回 队列 前 端 和 后 


。 deque.front_mut() 和 deque.back_mut() 与 vec.first_mut() 和 vec.Last_mut() 相似 ， 返 





回 Option<&mut T>。 


VecDeque 的 实现 是 环形 缓冲 区 ， 如 图 16-3 所 示 。 








VecDeque<char> 







缓冲 区 地 址 ; 
大 小 : 
起 点 ， 














图 16-3: VecDeque 在 内 存 中 的 布局 
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跟 vec 一 样 ，VecDeque 在 堆 中 有 一 块 内 存 保存 元 素 。 但 与 vec 不 同 ，VecDeque 的 数据 在 这 
块 内 存 中 并 不 总 是 从 头 开始 存储 ， 是 可 以 环绕 回来 的 ， 如 图 所 示 。 按 顺序 排列 ， 这 个 队列 
中 的 元 素 为 ['A'，'B'，'C'，'D'，'E']。VecDeque 有 私有 字段 ， 图 中 以 “起 点 ”和 “ 终 
点 ”标识 ， 用 于 保存 数据 在 缓冲 区 的 开始 和 结束 位 置 。 


向 队列 中 任何 一 端 添 加 值 都 意味 着 需要 一 个 未 被 使 用 的 模 位 ， 即 图 中 的 深 灰 色 区 块 。 添 加 
的 值 与 两 端 接触 ， 如 果 空 间 不 够 则 分 配 更 多 内 存 。 


VecDeque 自动 管理 环绕 ， 无 须 开 发 者 操心 。 图 16-3 是 Rust 之 所 以 让 .pop_front() 很 快 的 
底层 视图 。 

一 般 来 说 在 使 用 双向 队列 时 ， 只 需要 使 用 .push_back() 和 .pop_front() 两 个 方法 。 静 
态 方法 VecDeque::new() 和 VecDeque::with_capacity(n) 可 以 用 来 创建 队列 ， 与 对 应 的 
Vec 方 法 一 样 。Vec 的 很 多 方法 也 在 VecDeque 上 实现 了 ， 比 如 .len() 和 .is_empty()、 


.insert(index, value) 和 .remove(index)、.extend(iterabLe)， 等 等 。 


与 向 量 一 样 ， 队 列 可 以 按 值 、 按 共享 引用 或 按 可 修改 引用 迭代 。 它 们 有 3 个 迭代 器 方 
法 : .into_iter()、.iter() 和 .iter_mut()。 可 以 按 惯常 的 方式 通过 索引 来 访问 ， 比 如 


deque[index]。 


不 过 ， 由 于 队列 的 值 在 内 存 中 不 是 连续 存储 的 ， 因 此 它们 并 没有 继承 切片 的 所 有 方法 。 一 
种 在 队列 数据 上 执行 向量 和 切片 操作 的 方式 是 把 VecDeque 转换 为 vec， 执 行 操作 ， 然 后 再 
转换 回去 。 

。 Vec<T> 实现 了 From<VecDeque<T>>， 因 此 Vec::from(deque) 可 以 将 队列 转换 为 向 量 。 这 
个 操作 的 时 间 复 杂 度 为 0(n)， 因 为 可 能 需要 重 排 元 素 。 

。 VecDeque<T> 实现 了 From<Vec<T>>， pt i :from(vec) 可 以 将 向 量 转 换 为 队列 。 
这 个 操作 的 时 间 复 杂 度 也 是 O(n)， 但 通常 会 更 快 一 些 ， 即 便 向 量 很 大 。 原 因 在 于 疝 量 
的 堆 内 存 可 以 直接 转移 给 新 队列 。 

使 用 这 个 方法 可 以 方便 地 通过 指定 元 素来 创建 队列 ， 尽 管 没 有 标准 的 vec_deque![] 宏 : 


use std::collections::VecDeque; 
























































let v = VecDeque::from(vec![1, 2, 3, 4]); 


16.4 LinkedList<T> 


链表 是 男 一 种 存储 序列 值 的 方式 。 链 表 的 每 个 值 都 存储 在 独立 的 堆 内 存 中 ， 如 图 16-4 所 示 。 
std: :coLLections::LinkedList<T> 是 Rust 的 双向 链表 ， 支 持 VecDeque 的 部 分 方法 ， 包 括 
操作 序列 前 后 端的 方法 、 返 代 器 方法 、LinkedList: :new() 和 其 他 几 个 方法 。 不 过 ， 通 过 索 
引 访 问 元 素 的 方法 通常 就 没有 了 ， 因 为 通过 索引 访问 链表 元 素 效率 本 身 就 很 低 。 





























LinkedList<char> 

















16-4: LinkedList<char> 的 内 存 布局 


到 Rust 1.17 为 止 ，Rust 的 LinkedList 类 型 还 没有 从 列表 中 移 除 某 个 范围 内 元 素 的 方法 ， 
也 没有 在 列表 中 特定 位 置 插入 元 素 的 方法 。 当 然 ， 其 API 还 在 不 断 完 善 。 


目前 来 看 ，LinkedList 比 VecDeque 强大 的 地 方 主要 体现 在 组 合 两 个 列表 的 速度 非常 快 。 
list.append(&mut list2) 会 把 List2 的 元 素 都 转移 到 List 中 ， 只 需 修 改 儿 个 指针 即 可 ， 
此 时 间 复 杂 度 是 常量 。Vec 和 VecDeque 的 append 方法 有 时 候 必 须 把 很 多 值 从 一 个 堆 阵列 转 
移 到 另 一 个 。 





16.5 BinaryHeap<T> 

BinaryHeap 是 一 个 元 素 松散 组 织 的 集合 ， 而 且 最 大 值 始终 会 冒 泡 到 队列 前 端 。 以 下 是 3 个 
最 常用 的 BinaryHeap 方法 。 

。 heap.push(value) 问 堆 中 添加 值 。 


。 heap.pop() 从 堆 中 移 除 并 返回 最 大 值 。 返 回 类 型 为 0option<T >， 如果 堆 为 空 则 返回 None。 
。 heap.peek() 返回 堆 中 最 大 值 的 引用 。 返 回 类 型 为 0ption<&T>。 


BinaryHeap 也 支持 vec 的 部 分 方法 ， 包 括 BinaryHeap::new()、.Len()、.is_empty()、 
.Capacity()、.clear() 和 .append(&mut heap2) 。 


如 果 像 下 面 这 样 给 BinaryHeap 填充 一 批 数值 : 


use std::collections::BinaryHeap; 





Let mut heap = BinaryHeap::from(vec![2, 3, 8, 6, 9, 5, 4]); 
那么 数值 9 就 会 跑 到 堆 的 顶部 : 


assert_eq!(heap.peek(), Some(&9)); 
assert_eq!(heap.pop(), Some(9)); 


移 除 数值 9 还 会 导致 其 他 值 重 排 ， 之 后 数值 8 会 跑 到 顶部 ， 以 此 类 推 : 
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assert_eq!(heap.pop(), Some(8)); 
assert_eq!(heap.pop(), Some(6)); 
assert_eq!(heap.pop(), Some(5)); 


当然 ，BinaryHeap 并 不 限于 存储 数值 。 实 现 内 置 特 型 ord 的 任何 类 型 都 可 以 保存 在 
BinaryHeap 中 。 

BinaryHeap 可 以 用 作 工 作 队 列 。 比 如 ， 定 义 一 个 任务 结构 体 ， 基 于 优先 级 实现 ord， 让 高 
优先 级 任务 大 于 低 优先 级 任务 。 然 后 ， 创 建 一 个 BinaryHeap 保存 所 有 待 完成 的 任务 。 调 
用 .pop() 方法 始终 返回 接 下 来 要 做 的 最 重要 的 任务 。 

注意 ，BinaryHeap 是 可 迭代 类 型 ， 也 有 自己 的 .iter() 方法 ， 但 迭代 器 会 以 任意 顺序 产生 堆 
的 元 素 ， 而 不 是 从 大 到 小 。 要 按 优 先 级 顺序 消费 BinaryHeap 中 的 值 ， 需 要 使 用 while 循环 : 


while let Some(task) = heap.pop() { 
handle(task); 





} 


16.6 HashMap<K, V> 和 BTreeMap<K, V> 


映射 (map) 是 一 种 键 - 值 对 ( 称 作 条 目 ) 集合 。 条 目的 键 唯一 ， 而 且 条 目的 组 织 保证 可 
以 通过 键 高 效 获取 对 应 的 值 。 简 单 来 说 ， 映 射 就 是 一 个 查找 表 。 

Rust 提供 两 种 映射 类 型 : HashMap<K，V> 和 BTreeMap<K，V>。 这 两 种 类 型 共享 了 很 多 方法 ， 
区 别 在 于 两 者 为 快速 查找 而 设计 的 条 目 布 局 。 

HashMap 把 键 和 值 保存 在 一 个 散 列 表 中 ， 因 此 要 求 键 的 类 型 K 实现 标准 的 散 列 和 相等 性 特 
型 Hash 和 Eq。 

图 16-5 展示 了 HashMap 在 内 存 中 的 布局 。 空 白 区 块 是 未 使 用 的 。 所 有 键 、 值 和 缓存 的 散 列 
码 都 存储 在 一 个 分 配 在 堆 上 的 表 中 。 添 加 条 目 会 强制 HashMap 分 配 更 大 的 表 ， 然 后 把 所 有 
数据 都 转移 进去 。 








HashMap<i32, char> 














图 16-5: HashMap 的 内 存 布局 
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BTreeMap 按照 键 的 顺序 存储 条 目 ， 总 体 为 树 形 结构 ， 因 此 要 求 键 类 型 K 实现 0rd。 图 16-6 
展示 了 BTreeMap 的 存储 方式 。 深 色 区 块 表示 未 使 用 闲置 容量 。 














BTreeMap<i32, char> 














16-6; BTreeMap 的 内 存 布局 


BTreeMap 将 条 目 存储 在 节点 中 ， 其 中 大 多 数 节 点 只 包含 键 - 值 对 。 非 叶 节点 ， 即 图 中 的 根 
节点 ， 也 有 保存 子 节 点 指针 的 空间 。(20，'q' ) 和 (30，'r) 之 间 的 指针 指向 的 子 市 点 包含 
的 键 介 于 20 到 30 之 间 。 添 加 条 目 经 常 需要 将 已 有 节点 的 条 目 向 右 移动 以 保持 顺序 ， 偶 尔 
也 需要 分 配 新 节点 。 

图 16-6 为 适应 页 面 大 小 进行 了 简化 。 真 正 的 BTreeMap 节点 应 该 有 11 个 位 置 ， 而 不 止 4 个 。 
Rust 标准 库 使 用 B 树 而 不 使 用 平衡 二 又 树 的 原因 是 B 树 在 现代 硬件 上 更 快 。 二 又 树 每 次 
搜索 所 需 比 较 的 次 数 可 能 比 B 树 更 少 ， 但 搜索 B 树 的 领域 性 (locality) 更 好 。 换 名 话说 ， 
内 存 访问 集中 在 一 块 ， 而 不 是 分 散 到 整个 堆 上 。 这 样 CPU 缓存 就 很 少 错失 ， 从 而 显著 提 
升 速度 。 

可 以 使 用 如 下 方法 创建 映射 。 


HashMap: :new() 和 BTreeMap: :new() 创建 新 的 空 映射 。 
。 iter.collect() 可 用 于 从 键 - 值 对 创建 和 填充 新 HashMap 或 BTreeMap。iter 必须 是 一 个 
Iterator<Item=(K，V)>。 
HashMap: :with_capacity(n) 创建 新 的 空 散 列 映射 ， 至 少 能 容纳 nn 个 条 目 。 与 向 量 一 
样 ，HashMap 也 是 将 数据 存储 在 一 块 堆 内 存 中 ， 因 此 就 有 容量 相关 的 方法 hash_map. 
capacity()、hash_map.reserve(additional) 和 hash_map.shrink_to_fit()。BTreeMap 则 | 
没有 这 些 方 法 。 
HashMap 和 BTreeMap 拥有 与 键 和 值 相关 的 相同 的 核心 方法 。 


。 map.len() 返回 条 目 数 量 。 





























。 map.is_empty() 在 map 没有 条 目 时 返回 true。 

。 map.contains_key(&key) 在 映射 有 条 目的 键 为 key 时 返回 true。 

。 map.get(&key) 搜索 map 中 具有 给 定 key 的 条 目 。 如 果 找 到 了 匹配 的 条 目 ， 就 返回 
some(r)， 其 中 r 是 对 相应 值 的 引用 。 否 则 返回 None。 

。 map.get_mut(&key) 类 似 ， 但 返回 对 值 的 可 修改 引用 。 


一 般 来 说 ， 映 射 允 许 对 其 存储 值 的 可 修改 访问 ， 但 不 允许 修改 键 。 对 于 值 可 以 随意 修 
改 ， 但 键 属于 映射 本 身 ， 必 须 确保 不 改 ， 因 为 条 目 就 是 按照 键 来 组 织 的 。 直 接 修改 键 属 
于 bug。 


。 map.insert(key，value) 向 map 中 插入 条 目 (key，value)。 如 果 上 映射 中 已 经 存在 键 为 
key 的 条 目 ， 则 新 插入 的 value 会 覆盖 原来 的 值 。 


如 果 和 覆盖 了 原来 的 值 ， 则 返回 原来 的 值 。 返 回 类 型 为 0ption<V>。 


。 map.extend(iterable) 迭代 iterable 的 (K, V) 条 目 ， 并 将 每 个 键 - 值 对 插入 map 中 。 
。 map.append(&mut map2) 将 map2 的 所 有 条 目 转移 到 map 中 。 之 后 ，map2 变 空 。 
。 map.remove(&key) 查找 并 移 除 map 中 键 为 key 的 条 目 。 
如 果 有 值 被 移 除 ， 则 返回 移 除 的 值 。 返 回 类 型 为 0ption<V>。 
。 map.clear() 移 除 所 有 条 目 。 


还 可 以 使 用 方 括号 语法 map[&key] 查询 映射 。 这 意味 着 映射 实现 了 Index 内 置 特 型 。 不 过 ， 
如 果 不 存 在 键 为 key 的 条 目 则 会 证 异 ， 比 如 数组 访问 越界 。 因 此 要 保证 想 查找 的 条 目 确实 
存在 时 再 使 用 这 种 语法 。 

.Contains_key()、.get()、.get_mut() 和 .remove() 的 key 参数 不 一 定 正 好 是 类 型 &&。 这 
几 个 方法 对 于 可 以 从 K 借用 的 类 型 是 通用 的 。 比 如 ， 在 HashMap<String，Fish> 上 调用 
fish_map.contains_key("conger") 是 没 问 题 的 ， 虽 然 "conger" 并 不 是 String 类 型 ， 但 
String 实现 了 Borrow<&str>。 要 了 解 详 细 信 息 ， 参 见 13.8 市 。 


因为 BTreeMap<K，V> 按键 来 排序 并 存储 条 目 ， 所 以 它 还 支持 下 面 这 个 操作 。 


。 btree_map.split_off(&key) 将 btree_map 一 分 为 二 。 键 小 于 key 的 条 目 会 留 在 btree_map 
中 。 而 返回 的 新 BTreeMap<K，V> 包含 其 他 条 目 。 


16.6.1 条 目 


HashMap 和 BTreeMap 都 有 对 应 的 Entry 类 型 。Entry (条 目 ) 类 型 的 用 意 在 于 消除 多 余 的 映 
射 查找 。 例 如 ， 下 面 的 代码 会 取得 或 创建 一 条 学 生 记 录 : 
// 已 经 有 这 个 学 生 的 记录 了 吗 ? 
if !student_ map.contains key(name) { 
// 没有 : 创建 一 个 


student_map.insert(name.to_string(), Student::new()); 






























































// 现在 绝对 有 这 个 学 生 的 记录 了 


let record = student map.get mut(name).unwrap(); 
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这 样 当然 没 问题 ， 但 会 访问 两 次 或 3 次 student_map， 每 次 都 执行 同样 的 查找 操作 。 
而 使 用 条 目的 原因 在 于 可 以 只 查找 一 次 ， 然 后 产生 一 个 Entry 值 供 后 续 操作 使 用 。 下 面 这 
一 行 代码 等 价 于 前 面 的 所 有 代码 ， 但 只 有 一 次 查找 ， 

Let record = student_map.entry(name.to_string()).or_insert_with(Student: :new); 
student_map.entry(name.to_string()) 返回 的 Entry 值 类 似 于 指向 映射 中 某 个 位 置 的 可 修 
改 引 用 ， 要 么 已 经 被 一 个 键 - 值 对 占用 ， 要 么 是 空 着 的 〈vacant) ， 意 味 着 那里 还 没有 条 
目 。 如 果 是 空 着 的 ， 则 条 目的 .or_insert_with() 方法 会 插入 一 个 新 Student。 条 目的 多 数 
用 法 与 此 类 似 ， 简 单 明 了 。 
同样 的 方法 也 可 以 创建 Entry 值 。 

。 map.entry(key) 返回 键 为 key 的 Entry。 如 果 了 映射 中 没有 这 个 key， 则 返回 一 个 空 Entry。 
这 个 方法 接收 自己 的 可 修改 引用 ， 返回 生命 期 匹配 的 Entry: 

pub fn entry<'a>(&'a mut self, key: K) -> Entry<'a, K, V> 

这 里 的 Entry 类 型 有 一 个 生命 期 参数 'a， 这 是 因为 它 实 际 上 只 是 对 映射 的 一 个 借用 mut 
引用 。 只 要 Entry 存在 ， 它 就 拥有 对 映射 的 专 有 访问 权 。 
$52.5 节 介 ea, 以 及 这 样 做 对 生命 期 的 影响 。 现 在 我 们 从 
用 户 角度 看 到 了 这 种 情况 。Entry 就 是 这 样 的 。 
可 惜 的 是 ， 如 果 映 射 的 键 是 String 类 型 的 ， 则 不 能 给 这 个 方法 传 &str 类 型 的 引用 。 此 
时 ， 要 给 .entry() 方法 传人 真正 的 String。 

Entry 值 提供 了 两 个 填充 空 条 目的 方法 。 

。 map.entry(key) .or NS 保证 map 包含 键 为 key 的 条 目 ， 必 要 时 会 以 给 定 的 默 


认 value 插入 新 条 目 。 这 个 方法 返回 对 新 的 或 已 有 值 的 可 修改 引用 。 
假设 我 们 要 计算 投票 数 。 可 以 这 样 写 : 


Let mut vote counts: HashMap<String, usize> = HashMap: :new(); 
for name in ballots { 

let count = vote_counts.entry(name).or_insert(0); 

xCount += 1; 


} 













































































.or_insert() 返回 可 修改 的 引用 ， 因 此 这 里 count 的 类 型 是 &mut usize。 


。 map.entry(key).or_insert_with(default_fn) 也 一样， 建新 条 目 时 会 
调用 default_fn() 产生 默认 值 。 如 果 map 中 已 经 存在 键 为 key 的 条 目 ， 则 不 会 用 到 
default_fn, 
假设 我 们 想 知道 哪些 词 出 现在 了 哪些 文件 中 。 可 以 这 样 写 : 

// 这 个 映射 包含 每 个 单词 出 现 过 的 所 有 文件 


let mut word_occurrence: HashMap<String, HashSet<String>> = 
HashMap: :new(); 
for file in files { 














for word in read words(file)? { 
let set = word_occurrence 
.entry(word) 
.Or_insert _ with(HashSet: :new); 
set.insert(file.clone()); 
} 
} 


Entry 是 一 个 枚 举 类 型 ，HashMap 的 Entry 定义 类 似 下 轿 
似 ) : 


// (在 std: :coLLections: :hash_map 中 

pub enum Entry<'a, K: 'a, V: 'a> { 
Occupied(OccupiedEntry<'a, K, V>), 
Vacant(VacantEntry<'a, K, V>) 





i 这 样 (BTreeMap 的 Entry 定义 也 类 

















一 


这 里 的 0ccupiedEntry 和 VacantEntry 类 型 都 有 插入 、 移 除 和 访问 条 目 而 不 重复 查找 的 方 
法 。 可 以 通过 在 线 文 档 来 查阅 这 些 方法 。 侦 尔 ， 通 过 这 些 方法 可 以 消除 一 两 次 多 余 的 查 
找 ,， 但 .or_insert() 和 .or_insert_with() 已 经 涵盖 了 常见 情况 。 


16.6.2 ”映射 迭代 

迭代 映射 有 以 下 儿 种 方式 。 

。 按 值 迭代 (for (k，v) in map) 产生 (K, V) 对 。 这 样 会 消费 映射 。 

。 按 共 享 引 用 和 迭代 (for (k，v) in &map) 产生 (&K，8&V) 对 。 

。 按 可 修改 引用 友 代 (for (k，v) in &mut map) 产生 (&K，&mut V) 对 。( 同 样 ， 无 法 对 
映射 中 的 键 进行 可 修改 访问 ， 因 为 条 目 就 是 按照 自己 的 键 来 组 织 的 。) 

就 像 向 量 一 样 ， 上 映射 也 有 返回 迭代 器 且 产 生 值 引 用 的 .iter() 和 .iter_mut() 方法 ， 分 别 

与 迭代 &map 和 &mut map 类 似 。 此 外 ， 还 有 如 下 迭代 方法 。 

。 map.keys() 返回 产生 键 引用 的 迭代 器 。 

。 map.values() 返回 产生 值 引 用 的 迭代 器 。 

。 map.values_mut() 返回 产生 可 修改 值 引 用 的 迭代 器 。 


所 有 HashMap 迭代 器 都 以 任意 顺序 访问 映射 的 条 目 。BTreeMap 友 代 器 按键 顺序 访问 条 目 。 

















16.7 HashSet<T> 和 BTreeSet<T> 
集 是 为 快速 测试 成 员 关系 而 组 织 值 的 一 种 集合 。 


let b1 
let b2 


集中 永远 不 会 包含 同一 个 值 的 多 个 副本 。 


映射 和 集 有 不 同 的 方法 ， 但 在 后 台 集 就 类 似 于 只 有 键 〈 而 不 是 键 - 值 对 ) 的 映射 。 事实 
上 ，Rust 的 两 个 集 类 型 Hashset<T> 和 BTreeSet<T> 都 是 以 HashMap<T，()> 和 BTreeMap<T， 





large_vector.contains("needle"); // 惕 ， 检 查 每 个 元 素 
Large_hash_set.contains("needLe"); // 快 ， 散 列 查 找 


jol 








()> 的 包装 类 型 形式 实现 的 。 

。 Hashset: :new() 和 BTreeSet: :new() 创建 新 集 。 

。 iter.collect() 可 用 于 从 任何 进 代 器 创建 新 集 。 如 果 iter 产生 重复 的 值 ， 则 重复 的 值 
会 被 请 除 。 

。 Hashset: :with_capacity(n) 创建 空 的 Hashset， 至 少 可 以 容纳 nn 个 值 。 

Hashset<T> 和 BTreeSet<T> 有 几 个 共有 的 简单 方法 。 


。 set.len() 返回 set 中 值 的 数量 。 

。 set.is_empty() 在 集中 不 包含 元 素 时 返回 true。 

。 set.contains(&value) 在 集中 包含 给 定 的 value 时 返回 true。 

。 set.insert(value) 向 集中 添加 value。 如 果 添 加 成 功 就 返回 true， 如 果 集 中 已 经 存在 同 

样 的 值 则 返回 false。 

。 set.remove(&value) 从 集中 移 除 value。 如 果 移 除 成 功 就 返回 true， 如 果 集 中 已 经 没有 
这 个 值 了 则 返回 false。 

与 映射 类 似 ， 按 引用 查询 值 的 方法 也 是 通用 的 ， 只 要 可 以 从 T 借 用 到 该 类 型 。 要 了 解 详细 

信息 ， 参 见 13.8 节 。 


16.7.1 和 集 迭代 

有 两 种 方法 迭代 集 。 

。 按 值 偿 代 (for v in set) 产生 集 的 成 员 (并 且 消 费 集 )。 

。 按 共享 引用 返 代 (for v in &set) 产生 集成 员 的 共享 引用 。 

不 支持 按 可 修改 引用 进 代 集 。 没 有 办 法 从 集中 取得 值 的 可 修改 引用 。 
。 set.iter() 返回 迭代 器 ， 产 生 set 成 员 的 引用 。 


与 HashMap 迭代 器 一 样 ，Hashset 友 代 器 也 以 任意 顺序 产生 值 。BTreeset 和 迭代 器 则 按 顺序 
产生 值 ， 与 排序 后 的 向 量 一样 。 


16.7.2 ”相等 的 值 不 相同 
集 有 几 个 奇怪 的 方法 ， 这 些 方法 只 有 在 关心 “相等 ”的 值 之 间 的 差异 时 才 会 用 到 。 
这 种 差异 确实 经 党 存在 。 例 如， 两 个 相等 的 String 值 把 它们 的 字符 存储 在 内 存 中 的 不 同 
位 置 : 
let s1 = "hello".to_ string(); 
let s2 = "hello".to_ string(); 


println!("{:p}", &s1 as &str); // 0x7f8b32060008 
println!("{:p}", &s2 as &str); // 0x7f8b32060010 

























































































通常 我 们 不 会 在 意 这 种 差异 。 
但 万 一 需要 区 分 ， 可 以 使 用 下 列 方法 取得 存储 在 集中 的 实际 值 。 这 些 方法 都 返回 0ption， 
如 果 set 不 包含 匹配 的 值 则 返回 None。 
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set.get(&value) 返回 set 中 等 于 value 的 成 员 的 共享 引用 (如 果 有 的 话 )， 返 回 类 型 是 
Option<&T>。 

set.take(&value) 类 似 于 set.remove(&vatue)， 但 返回 移 除 的 值 (如 果 有 的 话 )， 返 回 
类 型 是 0ption<T>。 

set.replace(value) 类 似 于 set.insert(value),， 但 如 果 set 已 经 包含 等 于 value 的 值 ， 
那 这 个 方法 就 返回 原来 的 值 。 返 回 类 型 是 0ption<T>。 


16.7.3 整 集 操 作 

目前 ， 我 们 看 到 的 大 多 数 集 方法 只 涉及 一 个 集中 的 一 个 值 。 集 也 有 针对 整个 集 的 方法 。 
set1.intersection(&set2) 返回 同时 包含 在 set1 和 set2 中 的 所 有 值 的 友 代 器 。 
例如 ， 要 打印 既 选 了 脑 外 科 又 选 了 火箭 科学 课 的 学 生 的 名 字 ， 可 以 这 样 写 : 


for student in brain_cLass { 
if rocket class.contains(&student) { 
println!("{}", student); 














} 
} 


或 者 更 短 一 点 : 


for student ;in brain class.intersection(&rocket class) { 
println!("{}", student); 


让 人 吃惊 的 是 ， 居 然 还 有 一 个 专门 的 操作 符 。 


&set1 & &set2 返回 set1 和 set2 的 交集 。 这 是 一 个 二 进 制 按 位 与 操作 符 ， 应 用 到 了 两 
个 引用 。 这 样 就 找到 了 同时 在 set1 和 set2 中 的 值 。 


let overachievers = &brain class & &rocket class; 


set1.union(&set2) 返回 同时 包含 在 set1 和 set2 中 ， 或 者 只 在 set1 或 set2 中 的 值 的 迭 
代 器 。 
&set1 | &set2 返回 包含 这 两 个 集中 所 有 值 的 新 集 ， 即 查找 包含 在 set1 或 set2 中 的 值 。 
set1.difference(&set2) 返回 包含 在 set1 中 但 不 包含 在 set2 中 的 值 的 迭代 器 。 
&set1 - &set2 返回 包含 所 有 这 些 值 的 新 集 。 
set1.symmetric_difference(&set2) 返回 只 包含 在 set1 中 或 只 包含 在 set2 中 ， 但 不 同 
时 包含 在 两 个 集中 的 值 的 迭代 器 。 
&set1 ^ &set2 返回 包含 所 有 这 些 值 的 新 集 。 

下 面 是 测试 集 与 集 之 间 关 系 的 3 种 方法 。 
set1.is_disjoint(set2) 在 set1 和 set2 没有 共同 值 ( 即 它们 的 交集 为 空 ) 时 返回 true。 
set1.is_subset(set2) 在 set1 是 set2 的 子 集 ( 即 set1 的 所 有 值 也 都 在 set2 中 ) 时 返 
回 true。 
set1.is_superset(set2) 正好 相反 ， 在 set1 是 set2 的 超 集 时 返回 true。 


集 也 支持 = 和 != 的 相等 性 测试 。 两 个 集 在 包含 相同 的 值 时 相等 。 













































































集合 | 315 


16.8 ” 散 列 


std: :hash: :Hash 是 标准 库 中 可 散 列 类 型 的 特 型 。HashMap 的 键 和 Hashset 的 值 必须 同时 实 
现 Hash 和 Eq。 


大 多 数 实现 Eq 的 内 置 类 型 也 实现 了 Hash。 整 数 类 型 、char 和 string 都 是 可 以 散 列 的 ， 
此 只 要 元 组 、 数 组 、 切 片 和 向 量 的 元 素 是 可 以 散 列 的 ， 它 们 就 是 可 以 散 列 的 。 


标准 库 的 一 个 原则 是 一 个 值 无 论 保 存在 哪里 或 者 怎么 指向 它 ， 都 应 该 有 相同 的 散 列 码 。 
此 ， 引 用 与 它 指向 的 值 有 相同 的 散 列 码 ， 而 Box 与 装 箱 的 值 有 相同 的 散 列 码 。 向 量 vec 与 
包含 所 有 其 数据 的 切片 &ed[..] 有 相同 的 散 列 码 。String 与 引用 相同 字符 的 &str 有 相同 
的 散 列 码 。 
结构 体 和 枚 举 默 认 没有 实现 Hash， 但 可 以 派生 一 个 实现 : 

/// 大 英 博物 馆 中 一 件 藏 品 的 ID 编号 


#[derive(Clone, PartialEq, Eq, Hash)] 
enum MuseumNumber { 





、 








LI 











} 
只 要 类 型 的 字段 都 是 可 散 列 的 就 没 问 题 。 


如 果 手 工 为 一 个 类 型 实现 了 PartialEq， 那 么 也 应 该 手工 为 它 实 现 Hash。 例 如 ,假设 有 一 
个 表示 无 价 历史 珍宝 的 类 型 : 


struct Artifact { 
id: MuseumNumber, 
name: String, 
cultures: Vec<Culture>, 
date: RoughTinme, 





} 
如 果 两 个 Artifact 有 相同 的 ID ， 那 么 就 认为 它们 是 同一 件 东 西 : 


impl PartialEq for Artifact { 
fn eq(&self, other: &Artifact) -> bool { 
self.id == other.id 
} 
} 


impl Eq for Artifact {} 


因为 只 根据 ID 比较 藏品 ， 所 以 必须 使 用 相同 的 方式 计算 它们 的 散 列 码 : 


impl Hash for Artifact { 
fn hash<H: Hasher>(&self, hasher: &mut H) { 
// 委托 散 列 到 MuseumNumber 
self.id.hash(hasher); 











(否则 ，Hashset<Artifact> 将 不 能 正确 使 用 。 与 所 有 散 列 表 一 样 ， 它 要 求 如 果 a == b， 则 
必须 hash(a) == hash(b),) 


这 样 就 可 以 创建 Artifact 的 HashSset 了 : 
let mut collection = HashSet::<Artifact>: :new(); 


如 代码 所 示 ， 即 使 手工 实现 Hash， 也 不 需要 知道 任何 有 关 散 列 算法 的 事 。.hash() 接收 一 
个 Hasher 的 引用 ， 表 示 散 列 算法 。 只 要 把 涉及 == 比较 的 所 有 数据 传 给 这 个 Hasher 即 可 。 
Hasher 会 根据 传 入 的 数据 来 计算 一 个 散 列 码 。 


使 用 自 定义 散 列 算法 
hash 方法 是 泛 型 的 ， 因 此 上 面 展示 的 Hash 实现 可 以 把 数据 传 给 实现 Hasher 的 任何 类 型 。 
这 也 是 Rust 支持 可 捍 拔 散 列 算法 的 方式 。Hash 和 Hasher 是 伴 型 特 型 ， 详 情 参见 11.4.3 节 。 


第 三 个 特 型 std: :hash: :BuildHasher 针对 的 是 表示 散 列 算法 初始 状态 的 类 型 。 每 个 Hasher 
都 是 一 次 性 的 ， 类 似 和 友 代 器 ， 只 用 一 次 就 不 要 了 。 而 ButLdHasher 可 以 重用 。 


每 个 HashMap 都 包含 一 个 BuildHasher ， 每 次 计算 散 列 码 时 都 要 用 到 。BuildHasher 值 包含 
键 、 初 始 状态 或 散 列 算法 每 次 运行 时 需要 的 其 他 参数 。 


计算 散 列 码 的 完整 协议 如 下 : 


use std::hash::{Hash, Hasher, BuildHasher}; 




















fn compute_hash<B, T>(builder: &B, value: &T) -> u64 
where B: BuildHasher, T: Hash 





{ 
Let mut hasher = builder.build_hasher(); // 1. 算法 开始 
vaLue.hash(&mut hasher); // 2. 传人 数据 
hasher .finish() // 3. 完成 ， 产 生 u64 值 
} 


每 次 需要 计算 散 列 码 时 ，HashMap 都 会 调用 这 3 个 方法 。 所 有 方法 都 已 行内 化 ， 因 此 非常 快 。 


Rust 默认 的 散 列 算法 是 广为人知 的 SipHash-1-3 算法 。SipHash 很 快 ， 而 且 散 列 冲 突 控 制 
得 非常 出 色 。 事 实 上 ， 它 是 一 个 加 密 算法 ， 还 没有 已 知 的 高 效 方式 可 以 生成 SipHash-1-3 
冲突 。 只 要 有 不 同 之 处 ， 每 个 散 列 表 就 会 使 用 无 法 预测 的 键 。 因 此 Rust 可 以 防止 名 为 
HashDos 的 拒绝 服务 攻击 ， 即 攻击 者 故意 使 用 散 列 冲突 来 触发 服务 器 中 最 差 的 性 能 。 

不 过 ， 也 许 你 的 应 用 并 不 需要 防范 这 种 攻击 。 如 果 保 存 很 多 小 键 ， 如 整数 或 非常 短 的 字符 
串 ， 则 有 可 能 实现 更 快 的 散 列 函 数 。 代 价 就 是 可 能 有 被 HashDoS 攻击 的 风险 。fnv 包 实 现 
了 这 样 一 个 算法 ， 即 Fowler-Noll-Vo 散 列 。 如 果 想 试 一 试 ， 可 以 在 Cargo.toml 中 添加 这 么 
= 行 ; 




















[dependencies] 
fnv = "1.0" 


然后 从 fnv 中 导入 映射 和 散 列 类 型 : 





extern crate fnv; 
use fnv::{FnvHashMap, FnvHashSet}; 


可 以 使 用 这 两 种 类 型 直接 代替 HashMap 和 Hashset。 以 下 是 fnv 的 源 代码 中 对 上 面 两 个 类 型 
的 实现 : 

/// 默认 使 用 FNV 散 列 函数 的 HashMap 

pub type FnvHashMap<K, V> = HashMap<K, V, FnvBuildHasher>; 


/// 默认 使 用 FNV 散 列国 数 的 HashSet 

pub type FnvHashSet<T> = HashSet<T, FnvBuildHasher>; 
标准 的 HashMap 和 Hashset 集合 接收 可 选 的 额外 类 型 参数 ， 用 于 指定 散 列 算法 。FnvHashMap 
和 FnvHashset 是 HashMap 和 Hashset 的 泛 型 别名 ， 给 这 个 参数 传人 了 FNV 散 列 函数 。 


16.9 标准 集合 之 外 
在 Rust 中 创建 新 的 自 定义 集合 类 型 与 在 其 他 语言 中 大 臻 相同， 都 需要 基于 语言 提供 的 构 


建 块 (如 结构 体 和 枚 举 、 标 准 集 合 、0ption、Box， 等 等 ) 来 组 织 数 据 。 参 见 10.1.4 节 中 
BinaryTree<T> 类 型 的 例子 。 


如 果 你 习惯 了 在 C++ 中 实现 数据 结构 ， 使 用 原始 指针 、 手 工 内 存 管理 、 放 置 new、 显 式 调 
用 析 构 函数 来 获得 可 能 最 好 的 性 能 ， 那 么 无 疑 会 发 现 安全 的 Rust 相当 局 限 。 所 有 这 些 工具 
本 质 上 都 是 不 安全 的 。Rust 也 支持 这 些 操作 ， 只 是 必须 选择 在 不 安全 的 代码 中 使 用 。 第 21 
章 会 详细 介绍 如 何 使 用 不 安全 的 特性 ， 包 括 一 个 使 用 某 些 不 安全 代码 实现 安全 自 定 义 集合 
的 例子 。 


现在 ， 我 们 还 要 继续 沐浴 在 标准 集合 及 甚 安全、 高效 API 温暖 的 光臣 之 中 。 与 Rust 标准 
库 提供 的 多 数 特 性 一 样 ， 标 准 集合 的 设计 初 囊 就 是 让 编写 unsafe 的 代码 几乎 没有 可 能 。 























第 17 章 


字符 串 与 文本 





字符 串 是 一 个 赤裸 裸 的 数据 结构 ， 其 所 到 之 处 会 有 很 多 重复 ， 因 此 是 隐藏 信息 的 
绝 佳 工具 。 





Alan Perlis， 警 铅 #34 


本 书 已 经 用 到 了 Rust 的 几 种 主要 文本 类 型 : String、str 和 char。3.5 节 中 曾 介绍 过 字符 
和 字符 串 字面 量 的 语法 ， 也 展示 了 字符 串 在 内 存 中 的 表示 形式 。 本 章 将 更 深入 地 介绍 文本 
处 理 。 
本 章 内 容 如 下 。 
有 助 于 理解 标准 库 设 计 的 Unicode 相关 背景 知识 。 
介绍 表示 一 个 Unicode 码 点 的 char 类 型 。 
介绍 String 和 str 类 型 ， 二 者 分 别 表示 所 有 的 和 借用 的 Unicode 字符 序列 。 这 两 种 类 
型 拥有 很 多 方法 用 于 构建 、 搜 索 、 修 改 、 迭 代 其 内 容 。 
介绍 Rust 的 字符 串 格式 化 实用 工具 ， 比 如 printtn! 和 format! 宏 。 你 也 可 以 编写 自 定 
义 的 宏 来 处 理 字符 串 格 式 化 ， 或 者 扩展 已 有 的 宏 以 支持 自 定义 类 型 。 
介绍 Rust 对 正则 表达 式 的 支持 。 
最 后 谈 一 谈 为 什么 Unicode 规范 化 很 重要 ， 以 及 在 Rust 中 如 何 去 做 。 


17.1 Unicode 背景 知识 


本 书 是 讲 Rust 的 ， 不 是 讲 Unicode 的 。Unicode 已 经 出 了 不 少 书 了 。 但 是 ，Rust 的 字符 和 
字符 串 类 型 是 基于 Unicode 设计 的 。 在 此 还 是 有 必要 介绍 一 些 Unicode 背景 知识 ， 以 便 更 
好 地 理解 Rust。 
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17.1.1 ASCIl、Latin-1 和 Unicode 


Unicode 和 ASCI 中 所 有 的 ASCII 码 点 是 一 致 的 ， 从 9 到 0x7f 都 一 致 。 比 如 ， 二 者 中 字 
符 '*' 的 码 点 都 是 42。 类 似 地 ，Unicode 也 将 0 到 9x7f 分 配给 了 ISO/IEC 8859-1 字符 集中 
相同 的 字符 ， 后 者 是 ASCII 的 8 位 超 集 ， 用 于 西方 欧洲 语言 。Unicode 将 这 个 码 点 范围 称 
为 Latin-1 编码 块 (the Latin-l code block)， 因 此 可 以 用 更 好 记 的 名 字 ， 即 Latin-1 来 称呼 
ISO/IEC 8859-1。 


由 于 Unicode 是 Latin-1 的 超 集 ， 因 此 将 Latin-1 转换 为 Unicode 其 至 连 表 都 不 需要 : 


fn Latin1_to_char(Latin1: u8) -> char { 
Latin1 as char 





} 
反 向 转换 也 很 简单 ， 假 设 码 点 都 在 Latin-l 的 范围 内 : 


fn char_to_latini(c: char) -> Option<u8> { 
if c as u32 <= Oxff { 
Some(c as uy8) 


} else{ 
None 
} 
} 
17.1.2 UTF-8 


Rust 的 String 和 str 类 型 使 用 UTF-8 编码 格式 表示 文本 。UTF-8 将 字符 编码 为 1 到 4 个 
字 节 序列 ， 如 图 17-1 所 示 。 











UTF-8 编 码 Wm 码 点 表示 范围 
加 ObxxXXXXX 0 to Ox7f 
0bXXXXXyyyyyy 0X80to Ox7ff 
0bXXXyyyyyyZZZZZZ Ox800 to Oxffff 





| Obxxxyyyyyyzzzzzzwwwwww 0x10000 to Ox10ffff 











17-1: UTF-8 编码 





格式 良好 的 UTF-8 序列 有 两 个 限制 。 第 一 ， 丛 定 的 码 点 只 有 人 
式 良 好 的 ， 即 不 能 用 4 个 字 节 去 编码 只 需 3 节 的 码 点 。 这 条 规则 确保 一 个 码 点 只 

个 UTF-8 编码 。 第 二 ， 格 式 恨 好 的 UTF-8 和 0xd8099 到 9xdfff， 以 及 大 于 FF 人 的 
数值 不 编码 。 这 些 数值 要 么 不 用 来 表示 字符 ， 要 么 完全 超出 了 Unicode 的 范围 。 


图 17-2 给 出 了 一 些 例子 。 











UTF-8 编 码 (1~4 字 节 ) 码 点 表示 范围 
0b0101010 == 0x2a 第 








oo [oo 0b01110_111100== 0x3bc 。” 恬 
加 加 加 加 加 加 | 加西 加 中 古 加 





0b1001_001100_000110 ' 御 "(sabi: rust) 
== 0x9306 


0b000_011111_100110_ 仿 ' (crab emoji) 
000000 == 0x1f980 














17-2: UTF-8 示例 


注意 ， 即 便 螃 蟹 的 Emoji 编码 的 首 字 节 只 包含 0， 仍然 需要 4 个 字 节 来 对 其 编码 ， 因 为 3 
字 节 的 UTF-8 编码 只 能 表示 16 位 码 点 ， 而 9x1f989 是 17 位 长 的 。 


下 面 这 个 简 例 中 的 字符 串 包含 编码 长 度 不 一 的 字符 : 








assert eq!("3 Ch: udon".as_bytes(), 
&[Oxe3, Ox81, Ox86, // 3 
QOxe3, Ox81, Oxa9, // 上 上 
Oxe3, 0x82, 0x93, // A 
QOx3a, Ox20, OQx75, Ox64, Ox6f, Ox6e // : udon 
J 


图 17-2 展示 了 一 些 非常 有 用 的 UTF-8 属性 。 


由 于 UTF-8 对 码 点 9 到 9x7f 的 编码 就 是 字 节 6 到 9x7f， 因 此 保存 ASCI 文本 的 字 节 
是 有 效 的 UTF-8。 如 果 一 个 UTF-8 字符 串 只 包含 ASCII 字符 ， 则 反 过 来 说 也 是 正确 的 : 
UTF-8 编码 是 有 效 的 ASCII。 

Latin-1 与 UTF-8 并 不 具备 这 种 互 逆 性 。 比 如 ，Latin-1 编码 'é' 为 字 节 6xe9，UTF-8 会 
将 其 解释 为 一 个 三 字 节 编码 的 首 字 节 。 

通过 观察 任意 字 节 的 前 几 位 ， 立 即 就 能 知道 它 是 某 些 字符 UTF-8 编码 的 首 字 节 ， 还 是 
中 间 字 节 。 

通过 编码 首 字 节 的 前 几 位 就 能 知道 编码 的 总 长 度 。 

因为 编码 最 长 为 4 个 字 节 ， 所 以 UTF-8 处 理 不 需要 无 限 循 环 ， 这 对 于 处 理 不 受信 数据 
非常 重要 。 

在 格式 良好 的 UTF-8 中 ， 即 便 从 字 节 中 间 的 一 个 随机 点 开始 ， 也 总 可 以 无 玻 义 地 指出 
字符 编码 的 起 始 和 结束 位 置 。UTF-8 首 字 节 和 后 续 字 节 总 有 区 别 ， 因 此 一 个 编码 不 能 从 
另 一 个 编码 的 中 间 开 始 。 首 字 节 确定 编码 总 长 度 , 因此 没有 编码 可 以 是 其 他 编码 的 前 级 。 
这 样 也 相应 带 来 了 很 多 好 处 。 比 如 ， 从 UTF-8 字符 串 中 搜索 一 个 ASCII 定 界 符 只 需 扫 
描 定 界 符 的 字 节 即 可 。 这 个 定 界 符 不 可 能 是 其 他 多 字 节 编码 中 的 一 个 字 节 ， 因 此 根本 无 
须 考 虑 UTF-8 的 结构 。 类 似 地 ， 从 一 个 字符 串 中 搜索 另 一 个 字 节 字符 串 的 算法 无 须 修 
改 UTF-8 字符 串 ， 有 的 甚至 都 不 需要 检查 被 搜索 文本 的 所 有 字 节 。 


















































虽然 可 变 宽 度 编 码 比 固定 宽度 编码 更 复杂 ， 但 以 上 特点 让 UTF-8 比 想象 得 更 容易 使 用 。 
Rust 标准 库 为 我 们 处 理 了 大 多 数 的 复杂 细 市 。 
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17.1.3 ”文本 方向 性 


有 些 文字 是 从 左 向 右 书写 的 ， 比 如 拉丁 文 、 西 里 尔 文 、 泰 文 。 而 有 些 文字 是 从 右 向 左 书写 
的 ， 比 如 希 伯 来 文 、 阿 拉 伯 文 。Unicode 按照 文字 正常 情况 下 书写 或 阅读 的 顺序 存储 字符 。 
因此 对 于 希 伯 来 文 而 言 ， 字 符 串 的 首 字 节 保存 的 是 要 写 在 最 右边 的 字符 的 编码 : 


assert_eq!(" ao Ny".chars().next(), Some('y')); 


标准 库 中 有 些 方法 使 用 Left 和 right 表示 文本 的 开始 和 结束 。 在 描述 这 些 函 数 时 ， 我 们 会 
详细 说 明 它们 真正 的 意图 。 


17.2 ”字符 (char) 


Rust 的 char 类 型 是 保存 Unicode 码 点 的 32 位 值 。char 一 定 会 落 在 9 到 0xd7ff 或 者 0xe000 
到 9x19ffff 的 范围 内 。 所 有 用 于 创建 和 操作 char 值 的 方法 都 会 确保 这 一 点 。char 类 型 实 
现 了 Copy 和 Clone， 以 及 比较 、 散 列 、 格 式 的 所 有 常用 特 型 。 


在 下 文 的 介绍 中 ， 变 量 ch 的 类 型 就 是 char。 


17.2.1 字符 分 类 
char 类 型 有 一 些 方法 将 字符 分 为 几 个 常见 的 类 别 。 这 些 类 别 都 源 自 Unicode， 如 表 17-1 所 示 。 
表 17-1: 检测 字符 类 别 的 方法 
















































































广汉 简 介 示 例 
ch.is_numeric() 数值 字符 ， 包 括 Unicode 普通 类 别 “Number; digit” 和 '4'.is_numeric() 
“Number; letter”， 但 不 包括 “Number; other” 个 ' .is_numeric() 

!' ® '.is_numeric() 
ch.is_alphabetic() 字母 字符 ， 包 括 Unicode 的 “Alphabetic” 派 生 属性 'q'.is_alphabetic() 

' 七 '.is_alphabetic() 
ch.is_alphanumeric() 数值 或 字母 字符 ， 包 括 上 面 两 个 类 别 'g'.is alphanumeric() 

' 蚀 '.is_alphanumeric() 

!'*'.is_alphanumeric() 
ch.is_whitespace() 空白 字符 ， 包 括 Unicode 字符 属性 “WSpace=Y” ' '.is whitespace() 


'\n'.is whitespace() 

'\u{A0}' .is_whitespace() 
‘is_control() 控制 字符 ， 包 括 Unicode 的 “Other control” 普 通 类 别 '\n'.is_control() 

'\u{85}' .is_control() 


= 


© 


17.2.2 ”处 理 数字 
处 理 数 字 有 以 下 几 种 方法 。 


。 ch.to_digit(radix) 决定 ch 是 否 是 基数 为 radix 的 数字 。 如 果 是 ， 就 返回 Some(num)， 
其 中 num 是 u32。 人 否则， 返回 None。 这 个 方法 仅 适 用 于 ASCI 数字 ， 而 不 适用 于 
char::is_numeric 所 适用 的 更 广泛 的 字符 类 。radix 参数 的 范围 是 从 2 到 36。 如 果 
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radix 大 于 10， 那 么 ASCII 字母 (无论 大 小 写 ) 将 作为 值 为 10 到 35 的 数字 。 

















。 自由 函数 std::char::from_digit(num，radix) 可 以 把 u32 数字 值 num 转换 为 char (如 果 可 
以 的 话 )。 如 果 num 可 以 用 radix 基数 下 的 一 个 数字 表示 ， 那 么 from_digit 返回 Some(ch)， 














其 中 ch 就 是 数字 。 如 果 radix 大 于 10，ch 就 可 以 是 小 写字 母 。 否 则 ， 返 回 None。 




















执行 反 向 操作 的 方法 是 to_digit。 如 果 std::char::from_digit(num，radix) 是 Some(ch ) ， 
那么 ch.to_digit(radix) 就 是 Some(num)。 如 果 ch 是 ASCII 数字 或 小 写字 母 ， 则 反之 

















亦 然 


Vo 


。 ch.is_digit(radix) 在 ch 是 基数 为 radix 下 的 ASCII 数字 时 返回 true。 这 个 方法 等 价 





于 ch.to_digit(radix) != None。 


好 ， 来 看 几 个 例子 : 
assert eq!('F'.to digit(16), Some(15)); 


assert_eq!(std::char::from digit(15, 16), Some('f')); 
assert!(char::is digit('f', 16)); 


17.2.3 ”字符 大 小 写 转换 


有 关 字 符 大 小 写 的 方法 如 下 。 


。 ch.is_lowercase() 和 ch.is_uppercase() 表示 中 h 是 小 写字 母 字 符 还 是 大 写字 母 字 符 。 
它们 遵循 Unicode 的 Lowercase 和 Uppercase 派生 属性 ， 因 此 这 两 个 方法 也 适用 于 非 拉 


丁字 母 ， 如 希腊 字母 和 西里 尔 字 母 ， 当 然 对 ASCIL 字母 同样 有 用 。 








。 ch.to_lowercase() 和 ch.to_uppercase() 返回 迭代 器 ， 根据 Unicode 的 Default Case 











Conversion 算法 生成 ch 对 应 的 小 写 或 大 写字 符 : 


Let mut upper = 's'.to_uppercase(); 
assert_eq!(upper.next(), Some('S')); 
assert_eq!(upper.next(), None); 





这 两 个 方法 之 所 以 返回 迭代 器 而 不 是 字符 ， 是 因为 Unicode 中 的 大 小 写 转换 不 
对 一 的 过 程 ; 


// 德语 字母 "sharp 5S" 的 大 写 形式 是 "SS5": 
Let mut upper = 'B'.to_uppercase(); 
assert_eq!(upper.next(), Some('S')); 
assert_eq!(upper.next(), Some('S')); 
assert_eq!(upper.next(), None); 





// Unicode 中 Turkish 的 带 点 大 写 ' 计 转换 为 小 写 形式 是 "1 后跟 ' \u{f307] ' ， 
// 带 上 点 ， 这 样 再 转换 回 大 写 才 会 保留 上 面 的 点 

let ch = "i'; // ~'\u{130}" 

Let mut Lower = ch.to_ lowercase(); 

assert_eq!(lower.next(), Some('i')); 

assert_eq!(lower.next(), Some('\u{307}')); 
assert_eq!(lower.next(), None); 




















定 是 


为 方便 起 见 ， 这 些 达 代 器 都 实现 了 std::fmt::Display 特 型 ， 因 此 可 以 直接 将 它们 传 给 


7 


println! 或 writel! 宏 。 
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17.2.4 与 整数 相互 转换 
Rust 的 as 操作 符 可 以 把 char 转换 为 任何 整数 类 型 ， 高 位 会 被 静默 屏蔽 : 
assert eq!('B' as U32，66); 
assert_eq!(' 蚀 ' as u8，66);  // 高 位 被 截 掉 了 
assert_eq!(' 二 ' as i8, -116); // 同上 
as 操作 符 可 以 将 任何 u8 值 转换 为 char， 而 char 也 实现 了 Fron<u8>。 不 过 ， 更 宽 的 整 
数 类 型 可 以 表示 无 效 码 点 ， 因 此 必要 时 应 该 使 用 std: :char::fron_u32， 这 个 方法 返回 


Option<char>: 





assert eq!(char::from(66), 'B'); 
assert_eq!(std::char::from_u32(0x9942) ，Some(' 鲁 ')); 
assert_eq!(std::char::from_u32(0xd800) ，None); // 为 UTF-16 保 留 


17.3 String 与 str 


Rust 的 String 和 str 类 型 确保 只 保存 格式 良好 的 UTF-8。 为 此 ， 标 准 库 通过 限制 创建 
string 和 str 值 的 方式 以 及 对 它们 可 以 执行 的 操作 来 确保 这 一 点 。 这 样 ， 这 两 个 值 在 引入 
时 是 格式 良好 的 ， 使 用 时 也 是 如 此 。 相 关 的 方法 也 都 会 保证 安全 的 操作 不 会 引入 格式 错误 
的 UTF-8。 这 也 简化 了 操作 文本 的 代码 。 


Rust 将 文本 处 理 方法 放 在 str 还 是 String 上 ， 取 决 于 该 方法 是 需要 可 伸缩 缓冲 区 还 是 只 
需要 就 地 操作 文本 。 因 为 String 解 引 用 为 &str， 所 以 str 上 定义 的 所 有 方法 也 都 可 以 在 
String 上 直接 调用 。 本 市 会 介绍 这 两 个 类 型 上 的 所 有 方法 ， 按 大 致 的 功能 分 组 。 

文本 处 理 相关 的 方法 按照 字 节 偏 移 量 来 索引 文本 ， 也 按 字 节 来 度量 长 度 ， 并 不 按 字符 。 实 
践 中 ， 考 虑 到 Unicode 的 特点 ， 按 字符 索引 并 不 像 看 起 来 那么 有 用 。 反 而 按 字 方 偏 移 量 索 
引 更 快 也 更 简单 。 如 果 要 使 用 的 字 市 偏 移 量 恰 好 落 在 某 个 字符 UTF-8 编码 的 中 间 ， 方 法 则 
会 论 异 ， 因 此 不 能 以 这 种 方式 引入 格式 错误 的 UTF-8。 

String 实际 上 是 Vec<u8> 的 包装 类 型 ， 同 时 确保 向 量 内 容 始终 是 格式 良好 的 UTF-8。Rust 
不 会 修改 String 去 使 用 更 复杂 的 表示 ， 因 此 可 以 认为 String 与 Vec 性 能 相同 。 

在 接 下 来 的 介绍 中 ， 相 关 变量 与 对 应 类 型 如 表 17-2 所 示 。 

表 17-2: 变量 与 类 型 


变 。” 量 推测 类 型 













































































string String 

SLice &str 或 解 引用 为 &str 的 类 型 ， 比 如 String 或 Rc<String> 

ch char 

n usize， 长 度 

4 usize， 字 市 偏 移 量 

range usize 字 节 偏 移 量 范 围 ， 可 能 是 爹 限定 (i..j)、 部 分 限定 (i..、..j) 或 无 限定 (.…) 
pattern 任意 模式 类 型 ，char、String、&str、&[char] 或 FnMut(char) -> bool 








17.3.6 市 将 讨论 模式 类 型 。 
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17.3.1 创建 字符 串 值 
以 下 是 几 种 常见 的 创建 String 值 的 方式 。 


String::new() 返回 全 新 的 空 字 符 串 ， 此 时 没有 分 配 在 堆 上 的 缓冲 区 ， 后 续 会 根据 需要 
分 配 。 
String: :with_capacity(n) 返回 全 新 的 空 字符 串 ， 同 时 堆 上 会 预 分 配 至 少 能 容纳 mn 字 节 
的 缓冲 区 。 如 果 事 先知 道 要 构建 的 字符 串 的 长 度 ， 使 用 这 个 构造 函数 可 以 一 开始 就 得 到 
大 小 正确 的 缓冲 区 ， 从 而 避免 后 续 构 建 字符 串 时 再 调整 缓冲 区 大 小 。 当 然 ， 如 果 字 符 串 
长 度 超过 nm 字 节 ， 那 其 缓冲 区 仍 会 增 大 。 与 向 量 类 似 ， 字 符 串 也 有 capacity、reserve 
和 shrink_to_fit 方法 ， 不 过 一 般 来 说 默认 的 分 配 逻 辑 就 可 以 了 。 
slice.to_string() 分 配 一 个 全 新 的 String， 其 内 容 是 slice 的 副本 。 本 书 已 经 多 次 用 
到 类 似 "literal text".to_string() 这 样 的 表达 式 通 过 字符 串 字 面 量 创 建 String 了 。 
iter.collect() 通过 拼接 进 代 器 的 所 有 项 (可 以 是 char.&str 或 String 值 ) 来 构建 字符 串 。 
比如 ， 要 删除 一 个 字符 串 中 的 所 有 空格 ， 可 以 这 样 写 ; 

let spacey = "man hat tan"; 

let spaceless: String = 


spacey.chars().filter(|c| i!c.is whitespace()).collect(); 
assert_eq!(spaceless, "manhattan"); 










































































这 样 使 用 collect 是 利用 了 String 对 std: :iter::FromIterator 特 型 的 实现 。 

&str 类 型 不 能 实现 CLone， 这 个 特 型 要 求 对 8T 的 克隆 返回 一 个 T 类 型 的 值 ， 但 str 是 
非 国定 大 小 的 。 不 过 ，&str 实现 了 Toowned， 实 现 者 可 以 指定 自己 拥有 的 等 价值 ， 因 此 
slice.to_owned() 将 slice 的 副本 作为 一 个 全 新 分 配 的 String 返回 。 





























17.3.2 ”简单 检查 
以 下 方法 可 以 从 字符 串 切 片 获得 基本 信息 。 


slice.len() 返回 以 字 节 计 的 sLice 的 长 度 。 
slice.is_empty() 在 slice.len() == 0 时 返回 true。 
slice[range] 返回 借用 slice 中 指定 部 分 的 切片 。 部 分 限定 和 无 限定 范围 都 可 以 , 比如 : 
Let full = "bookkeeping"; 
assert eq!(&full[..4], "book"); 
assert eq!(&full[5..], "eeping"); 
assert eq!(&full[2..4], "ok"); 
assert eq!(full[..].len(), 11); 
assert_eq!(full[5..].contains("boo"), false); 


不 能 像 stice[i] 一 样 仅 用 一 个 位 置 索 引 字符 串 切 片 。 从 给 定 的 字 节 偏 移 值 取得 一 个 
字符 有 点 麻烦 。 必 须 先 基于 切片 产生 一 个 chars 迭代 器 ， 让 迭代 器 解析 出 相应 字符 的 
UTF-8 : 





























let parenthesized = "Rust ( 鲤 )"; 
assert_eq!(parenthesized[6..].chars().next()，Some(' 鲁 ' )); 


好 在 很 少 需要 这 样 做 。Rust 也 提供 了 迭代 切片 的 更 便捷 方式 ，17.3.8 市 会 介绍 。 
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。 slice.split_at(i) 返回 从 sLice 借用 的 两 个 共享 切片 的 元 组 ， 第 一 个 截止 到 字 节 偏 移 


值 i， 第 二 个 从 i 之 后 开始 。 换 名 话说， 就 是 返回 (slice[..i], slice[li..])。 











。 slice.is_char_boundary(i) 在 字 节 偏 移 值 i 落 在 字符 边界 上 时 返回 true， 因 此 适合 作 


为 sLice 的 偏 移 值 。 
自然 地 ， 切 片 可 以 比较 相等 、 顺 序 和 散 列 。 比 较 顺 序 只 是 简单 地 将 字符 串 看 成 Unicode 码 




















点 的 序列 ， 并 按照 字典 顺序 对 它们 进行 比较 。 


17.3.3 ”追加 和 插入 文本 

以 下 方法 可 以 向 String 中 添加 文本 。 

。 string.push(ch) 会 把 字符 ch 追加 到 string 末尾 。 
。 string.push_str(slice) 会 追加 SLice 的 全 部 内 容 。 


。 string.extend(iter) 将 磷 代 器 iter 生成 的 所 有 项 追加 到 字符 串 。 迭 代 器 可 以 生成 
char、str 或 String 值 。 这 些 都 是 String 对 std: :iter::Extend 的 实现 。 





Let mut also_spaceless = "con".to_string(); 
also_spaceless.extend("tri but ion".split whitespace()); 
assert_eq!(also_spaceless, "contribution"); 


。 string.insert(i，ch) 会 在 字 节 偏 移 值 i 的 位 置 向 string 中 插入 字符 ch。 这 会 导致 i 
之 后 的 所 有 字符 移 位 以 便 给 ch 腾 出 位 置 。 因 此 以 这 种 方式 构建 字符 串 需要 的 时 间 与 字 
符 串 长 度 的 平方 成 正比 。 

。 string.insert_str(i，slice) 与 insert 一 样 ， 只 不 过 是 插入 slice 的 内 容 ， 当 然 也 同 

















样 有 性 能 问题 。 


String 实现 了 std::fmt::Write， 也 就 意味 着 write! 和 writeln! 宏 可 以 给 String 追加 格 
式 化 文本 : 





因为 


use std::fmt::Write; 


let mut Letter = String::new(); 
writeln!(letter, "Whose {} these are I think I know", "rutabagas")?; 
writeln!(letter, "His house is in the village though;")?; 
assert_eq!(letter, "Whose rutabagas these are I think I know\n\ 

His house is in the village though;\n"); 


write! 和 writeln! 是 用 于 写 入 输出 流 的 ， 所 以 它们 返回 一 个 Result， 如 果 不 处 理 错 




















误 Rust 会 编译 不 通过 。 上 面 的 代码 使 用 ? 操作 符 来 处 理 了 错误 ,但 写 入 String 是 不 会 出 


错 的 
由 于 








， 因 此 在 这 里 调用 .unwrap() 也 可 以 。 
String 实现 了 Add<&str> 和 AddAssign<&str>， 因 此 可 以 这 样 编写 代码 : 

















Let Left = "partners" .to_string(); 
let mut right = "crime".to_string(); 
assert eq!(left + "in " + &right, "partners in crime"); 
right += " doesn't pay"; 

assert eq!(right, "crime doesn't pay'"); 





在 操作 数 为 字符 串 时 ，+ 操作 符 会 取得 其 左 操作 数 的 值 ， 因 此 实际 上 可 以 重用 相 加 得 到 的 
结果 String。 而 且 ， 如 有 果 左 操作 数 的 缓冲 区 足够 大 以 保存 结果 ， 就 不 会 发 生 重新 分 配 。 


很 可 惜 这 里 少 了 对 称 性 ，+ 的 左 操作 数 不 能 是 &str， 因 此 不 能 这 样 用 : 
let parenthetical = "(" + string + ")"; 

而 必须 这 样 : 
let parenthetical = "(".to_string() + &string + ")"; 


不 过 ， 这 一 限制 确实 导致 很 难 从 未 尾 反方 向 构建 字符 串 。 这 种 方法 性 能 很 差 ， 因 为 文本 必 
须 朝 缓冲 区 未 尾 重复 移动 。 


可 是 以 向 尾部 追加 小 片段 的 方式 构建 字符 串 则 性 能 很 好 。Sstring 的 行为 类 似 向 量 ， 在 需要 
更 大 容量 时 至 少 会 将 缓冲 区 扩大 一 倍 。 正 如 3.4.3 节 所 解释 的 ， 重 新 复制 的 开销 取决 于 最 
终 大 小 。 即 便 如 此 ， 使 用 String: :with_capacity 从 一 开始 就 创建 缓冲 区 大 小 合适 的 字符 
串 ， 可 以 避免 重新 分 配 ， 减 少 调用 堆 分 配 程序 的 次 数 。 


17.3.4 删除 文本 


string 有 几 个 删除 文本 的 方法 (不 影响 字符 串 的 容量 。 如 果 需 要 释放 内 存 ， 可 以 使 用 shrink_ 
to_fit) 。 


string.clear() 将 string 重 置 为 空 字符 串 。 

string.truncate(n) 会 丢弃 字 节 偏 移 值 n 之 后 的 所 有 字符 , 导致 string 的 长 度 最 大 为 n。 
如 果 string 不 足 n 字 节 ， 调 用 此 方法 则 没有 效果 。 

string.pop() 从 string 中 删除 最 后 一 个 字符 (前提 是 有 字符 ), 并 以 0ption<char> 方式 返回 。 
string.remove(i) 从 string 中 删除 字 节 偏 移 值 i 所 在 的 字符 并 返回 该 字符 ， 后 面 的 字 
符 癌 前 移动 。 所 花 时 间 与 后 面 字符 的 数量 成 正比 。 

string.drain(range) 根据 给 定 字 节 索 引 的 范围 返回 迭代 器 ， 并 且 在 迭代 器 被 清除 时 删 
除 相应 字符 。 删 除 范 围 后 ， 范 围 之 后 的 字符 向 前 移动 ， 

Let mut choco = "chocolate".to_string(); 


assert_eq!(choco.drain(3..6).collect::<String>(), "col"); 
assert eq!(choco, "choate"); 


如 果 只 想 删 除 范 围 ， 那 么 马上 清除 迭代 器 ， 不 从 中 取 值 即 可 : 


Let mut winston = "Churchill".to_string(); 
winston.dratn(2..6); 
assert_eq!(winston, "Chill"); 


17.3.5 ”搜索 与 迭代 的 约定 
Rust 标准 库 中 与 搜索 和 友 代 文本 相关 的 国 数 ， 在 命名 上 遵循 了 一 些 约定 ， 以 方便 记忆 。 


大 多 数 操作 从 头 到 尾 处 理 文本 ， 但 名 字 以 上 开头 的 操作 从 后 向 前 处 理 。 比 如 ，rsplLit 是 
split 的 从 后 向 前 的 版 本 。 某 些 情况 下 ， 改 变 处 理 方 向 不 仅 会 影响 产生 值 的 顺序 ， 也 会 


县 : 


影响 值 本 身 。 具 体 的 例子 参见 图 17-3。 
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迭代 器 的 名 字 如 果 以 mn 结尾 ， 就 表示 会 对 自己 限定 匹配 的 次 数 。 
迭代 器 的 名 字 如 果 以 -indices 结尾 ， 表 示 会 产生 它们 在 切片 中 的 字 节 偏 移 量 ， 以 及 通 
常 可 迭代 的 值 。 


标准 库 没 有 提供 所 有 操作 的 全 部 组 合 。 比 如 ， 很 多 操作 不 需要 带 n 的 变 体 ， 提 前 结束 迭代 
也 非常 简单 。 
17.3.6 ”搜索 文本 的 模式 


当 标 准 库 函数 需要 搜索 (search)、 匹 配 (match)、 分 割 (split) 或 修剪 (trim) 文本 时 ， 它 
接收 几 种 不 同类 型 的 参数 来 表示 要 查找 的 内 容 : 


let haystack = "One fine day, in the middle of the night"; 





assert_eq!(haystack.find(','), Some(12)); 
assert_ eq!(haystack.find("night"), Some(35)); 
assert_eq!(haystack.find(char::is whitespace), Some(3)); 


这 些 类 型 被 称 作 模 式 (pattern)， 且 大 多 数 操作 支持 它们 : 


assert_eq!("## Elephants" 
.trim left matches(|ch: char| ch == '#' || ch.is whitespace()), 
"Elephants"); 


标准 库 支持 4 种 主要 的 模式 。 
char 作为 模式 用 于 匹配 字符 。 

String、&str 或 &&str 作为 模式 用 于 匹配 等 于 模式 的 子 字符 串 。 

。 FnMut(char) -> bool 闭 包 作为 模式 用 于 匹配 闭 包 返回 true 的 一 个 字符 。 

。 &[char] 作为 模式 (不 是 &str ,而 是 char 值 的 切片 ) 用 于 匹配 出 现在 列表 中 的 任 一 字符 。 
注意 ， 如 果 你 将 列表 作为 数组 字面 量 写 出 来 ， 那 可 能 需要 使 用 as 表达 式 将 其 转换 为 正 
确 的 类 型 。 

let code = "\t function noodle() { "; 
assert eq!(code.trim left matches(&[' ', '\t'] as &[char])， 
"function noodle() { "); 
// 更 短 的 写法 : &\[" ',，'\t"][..] 
否则 ，Rust 在 看 到 固定 大 小 的 数组 类 型 &[char; 2] 时 会 不 知 所 措 ， 
类 型 。 

在 标准 库 自己 的 代码 中 ， 模 式 可 以 是 实现 std::str::Pattern 特 型 的 任何 类 型 。Pattern 的 具 

体 细 市 还 没有 稳定 ， 因 此 在 稳定 版 的 Rust 中 还 不 允许 自 定义 类 型 实现 它 。 不 过 ， 这 局 门 已 经 

对 将 来 的 正则 表达 式 和 其 他 复杂 模式 打开 了 。Rust 保证 当前 支持 的 模式 类 型 在 将 来 仍然 有 效 。 


17.3.7 ”搜索 与 替换 
Rust 提供 了 几 个 按 模式 搜索 切片 中 的 目标 的 方法 ， 有 些 方法 还 支持 用 新 文本 替换 目标 。 


slice.contains(pattern) 在 slice 包含 与 pattern 匹配 的 内 容 时 返回 true。 

















Ba 


为 这 不 是 模式 




















。 slice.starts_with(pattern) 和 sLice.ends_with(pattern) 在 slice 的 初始 或 最 终 文 本 
与 pattern 匹配 时 返回 true。 





assert!("2017".starts_with(char::is_ numeric)); 


。 slice.find(pattern) 和 slice.rfind(pattern) 在 slice 包含 匹配 pattern 的 内 容 时 返回 
Sone(t)， 其 中 宇 是 匹配 项 的 字 节 偏 移 量 。find 方法 返回 第 一 个 匹配 ，rfind 方法 返回 最 
后 一 个 匹配 。 

let quip = "We also know there are known unknowns " ; 
assert_eq!(quip.find("know"), Some(8)); 
assert eq!(quip.rfind("know"), Some(31)); 


assert_ eq!(quip.find("ya know"), None); 
assert_ eq!(quip.rfind(char::is uppercase), Some(0)); 




















。 slice.replace(pattern，replacement) 返回 以 replacement 替换 所 有 匹配 pattern 的 内 
容 之 后 得 到 的 新 String。 
assert_eq!("The only thing we have to fear is fear itself" 


.replace("fear", "spin"), 
"The only thing we have to spin is spin itself"); 





assert eq!("‘Borrow and ‘BorrowMut™" 
.replace(|ch:char| !ch.is _alphanumeric(), ""), 
"BorrowandBorrowMut" ); 


。 slice.replacen(pattern，replacement, n) 同上 ， 只 是 最 多 替换 前 n 个 匹配 项 。 


17.3.8 ”迭代 文本 
Rust 标准 库 提 供 了 几 种 友 代 切片 文本 的 方式 。 图 17-3 展示 了 其 中 几 个 例子 。 


5 oo 国 六 9 








Slice.bytes() a Be ed Bed ed ed (el a (a 本 (ed le ES ed ES IE ES a ed ES u8 
.Chars() [es es le ee es le | es | al [es len | | ee ms le es ees | char 
.split(" ") J] 
.Split_ terminator(" ') EE IN | 
-fsplit_terminator( ) [ WU NI | 
.Split_whitespace() [WU | [| 
splitn(3," '") EE WU | &str 
.Tsplitn(3," ') [ “<! 


.matches( rr 7) 
.Split("rr") 


IE 
.tsplit("rr") ss 











图 17-3: 迭代 切片 的 一 些 方式 
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split 和 match 系列 方法 是 相互 补充 的 ， 因 为 分 割 的 结果 其 实 就 是 匹配 项 之 间 的 范 














| 











对 某 些 模式 而 言 ， 从 后 向 前 搜索 可 能 会 改变 产生 的 值 。 比 如 ， 图 17-3 中 基于 模式 "rr" 的 
分 割 。 始 终 匹 配 一 个 字符 的 模式 不 会 出 现 这 个 结果 。 如 果 一 个 迭代 器 能 够 在 任何 方向 都 产 
生 相同 的 匹配 项 集合 ( 即 只 有 顺序 不 同 )， 则 这 个 迭代 器 就 是 一 个 DoubleEndedIterator， 
意味 着 可 以 使 用 其 rev 方法 按 男 一 个 顺序 迭代 ， 即 可 以 从 任何 一 端 取 值 。 



































slice.chars() 基于 slice 的 字符 返回 一 个 迭代 器 。 
slice.char_indices() 基于 stLice 的 字符 及 它们 的 字 节 偏 移 量 返回 一 个 迭代 器 。 
assert eq!("élan".char_indices().collect::<Vec<_ >>(), 
vec![(0，'é'),// 有 一 个 双 字 节 UTF-8 编 码 
(25 Ls 
(33 "a 7 
(4, 'n')]); 
注意 ， 这 跟 .chars().enumerate() 不 同 ， 因 为 它 会 提供 每 个 字符 在 切片 中 的 字 节 偏 移 
量 ， 而 不 仅仅 是 字符 编号 。 


slice.bytes() 基于 slice 中 的 个 别 字 届 返回 一 个 迭代 器 ， 暴 露 UTF-8 编码 。 


assert_eq!("eLan'" .bytes().coLLect: :<Vec<_>>()， 
vec![195, 169, b'l', b'a', b'n']); 
slice.lines() 基于 slice 中 的 行 返回 一 个 迭代 器 。 行 的 终止 符 是 "\n" 或 "\r\n"。 这 个 
迭代 器 产生 的 值 是 从 sLice 借用 的 &str。 另 外 ， 产 生 的 值 不 包含 行 终止 符 。 
slice.split(pattern) 基于 按照 pattern 分 割 slice 得 到 的 部 分 返回 一 个 迭代 器 。 两 个 
相 邻 的 匹配 或 者 与 slice 开头 、 结 尾 的 匹配 都 会 返回 空 字符 串 。 
slice.rsplit(pattern) 同上 ， 只 不 过 是 从 后 向 前 扫描 slice， 而 且 按 该 顺序 进行 匹配 。 
slice.split_terminator(pattern) 和 sLice.rspLit_terminator(pattern) 与 上 一 个 方法 
类 似 , 只 不 过 pattern 被 当成 终止 符 而 不 是 分 隔 符 。 如 果 pattern 恰好 匹配 stlice 的 两 头 ， 
那么 迭代 器 不 会 ( 像 split 和 rsplit 那样 ) 生成 表示 匹配 与 切片 两 头 之 间 空 字符 串 的 
空 切片 。 例 如 ; 
//“: "字符 在 这 里 是 分 隔 符 ， 注 意 最 后 的 ”" 
assert_eq!("jimb:1000:Jim BLandy:".spLit(':').coLLect::<Vec<_>>()， 
vec!["jimb", "1000", "Jim Blandy", ""]); 
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// “\n 字符 在 这 里 是 终止 符 
assert_eq!("127.0.0.1 localhost\n\ 
127.0.0.1 www.reddit.com\n" 
.Split_ terminator('\n').collect::<Vec<_ >>(), 
vec!["127.0.0.1 localhost", 
"127.0.0.1 www.reddit.com"]); 


// 注意 ， 最 后 没有 ""! 
slice.splitn(n，pattern) 和 slice.rsplitn(n，pattern) 跟 split 和 rsplit 类 似 ， 
不 过 最 多 把 字符 串 分 割 成 n 个 切片 ， 从 pattern 的 第 1 次 匹配 到 第 n-1 次 匹配 。 








并 











。 slice.split_whitespace() 基于 空白 将 sLice 分 隔 的 部 分 返回 一 个 进 代 器 。 连 续 多 
个 空白 字符 作为 一 个 分 隔 符 。 末 尾 的 空白 会 被 忽略 。 这 里 空白 的 定义 与 char::is_ 
whitespace 中 相同 。 

let poem = "This is just to say\n\ 
I have eaten\n\ 


the plums\n\ 
again\n"; 
assert_eq!(poem.split whitespace().collect::<Vec<_ >>(), 
vec!["This", "is", "just", "to", "say", 
"I", "have", "eaten", "the", "plums", 
"again"]); 


。 slice.matches(pattern) 林 于 pattern 在 slice 中 找到 的 匹配 项 返回 一 个 迭代 器 。 
slice.rmatches(pattern) 也 一 样 ， 只 不 过 是 从 后 向 前 迭代 。 

。 slice.match_indices(pattern) 和 slice.rmatch_indices(pattern) 跟前 面 的 方法 类 似 ， 
只 不 过 产生 的 值 是 (offset，match) 对 ， 其 中 offset 是 匹配 开始 位 置 的 字 市 偏 移 量 ， 
match 是 匹配 的 切片 。 





17.3.9 ”修剪 

修剪 (trim) 字符 串 就 是 从 字符 串 的 开头 和 末尾 去 掉 内 容 (通常 是 空白 符 )。 修 剪 常用 于 清 

纤 从 文件 中 读 到 的 带 缩 进 的 文本 ， 或 者 一 行 末 尾 意外 带 着 的 空白 符 ， 以 便 让 结果 更 清晰 。 

。 slice.trim() 返回 slice 的 子 切片 ， 不 包含 开头 和 末尾 的 空白 符 。slice.trim_left() 
只 省 略 开 头 的 空白 符 ，slice.trim_right() 只 省 略 未 尾 的 空白 符 。 


assert eq!("\t*.rs ".trim(), "*.rs"); 
assert eq!("\t*.rs ".trim left(), "*.rs "); 
assert eq!("\t*.rs ".trim right(), "\t*.rs"); 


。 slice.trim_matches(pattern) 返回 slice 的 子 切片 ， 不 包含 开头 和 末尾 匹配 pattern 的 
内 容 。trim_left_matches 和 trim_right_matches 方法 仅 对 开头 或 未 尾 的 匹配 执行 同样 
的 操作 。 


assert_eq!("001990" .trim_Left_matches('0' )，"1990"); 


注意 ， 以 上 方法 名 中 的 left 和 right 分 别 指 的 是 切片 的 开头 和 末尾 ， 与 切片 中 文本 的 方向 
无 关 。 


17.3.10 ”字符 串 大 小 写 转 换 


方法 slice.to_uppercase() 和 slice_to_lowercase() 返回 新 分 配 的 字符 串 ， 其 保存 着 转换 
为 大 写 或 小 写 之 后 的 slice 文本 。 结 果 的 长 度 不 一 定 与 slice 相同 ， 参 见 17.2.3 节 。 


17.3.11 ”从 字符 串 解析 出 其 他 类 型 


Rust 为 从 字符 串 中 解析 值 和 产生 值 的 文本 化 表示 提供 了 标准 的 特 型 。 




































































字符 串 与 文本 | 331 




















如 果 一 个 类 型 实现 了 std::str::FromStr 特 型 ， 那 么 它 就 拥有 从 字符 串 切 片 中 解析 值 的 标 
准 方法 : 
pub trait FromStr: Sized { 


type Err; 
fn from str(s: &str) -> Result<Self, Self::Err>; 


} 

所 有 常见 的 机 器 类 型 都 实现 了 FromStr ; 
use std::str::FromStr; 
assert_eq!(usize::from_str("3628800"), Ok(3628800)); 
assert_ eq!(f64::from_str("128.5625"), Ok(128.5625)); 


assert_eq!(bool::from_str("true"), Ok(true)); 


assert!(f64::from str("not a float at all").is_err()); 
assert!(bool::from_str("TRUE").is_err()); 


用 于 存储 IPv4 或 IPv6 互联 网 地 址 的 枚 举 (enum) 类 型 std: :net::IpAddr 也 实现 了 FromStr: 


use std::net::IpAddr; 





Let address = IpAddr::from_str("fe80::0000:3ea9:f4ff:fe34:7a50")?; 
assert_eq!(address, 

IpAddr::from([Oxfe80, 0, 0, 0, Ox3ea9, Oxf4ff, Oxfe34, Ox7a50])); 
字符 串 切片 有 一 个 parse 方法 ， 其 可 以 将 切片 解析 为 你 想 要 的 任何 类 型 ， 可 以 假设 它 实现 
了 FromStr。 与 Iterator::collect 一 样 ， 有 时 候 可 能 需要 写 出 想 要 的 类 型 ， 因 此 parse 并 
不 总 是 比 直接 调用 from_str 更 清晰 : 


Let address = "fe80::0000:3ea9:f4ff:fe34:7a50" .parse: :<IpAddr>()?; 


17.3.12 将 其 他 类 型 转换 为 字符 串 

将 非 文本 值 转换 为 字符 串 主要 有 3 种 方式 。 

。 具有 人 类 可 读 的 自然 打印 形式 的 类 型 可 以 实现 std: :fmt::Dtsptay 特 型 ， 这 样 就 可 以 在 
format! 宏 中 使 用 {} 格式 说 明 符 了 : 


assert eq!(format!("{}, wow", "doge"), "doge, wow"); 

assert eq!(format!("{}", true), "true"); 

assert eq!(format!("({:.3}, {:.3})", 0.5, f64::sqrt(3.0)/2.0), 
"(0.500, 0.866)"); 











// 使 用 上 面 的 address 
Let formatted addr: String = format!("{}", address); 
assert_ eq!(formatted _addr, "fe80::3ea9:f4ff:fe34:7a50"); 


与 字符 、 字 符 串 和 切片 一 样 ，Rust 的 所 有 机 器 数值 类 型 都 实现 了 DispLay。 对 于 智能 指 
针 类 型 而 言 ， 如 果 T 实 现 Display， 则 Box<T>、Rc<T> 和 Arc<T> 也 就 实现 了 : 它们 打印 
出 来 的 形式 就 是 它们 引用 目标 的 形式 。vec 和 HashMap 等 容器 没有 实现 Display， 因 为 这 
些 类 型 没有 唯一 人 类 可 读 的 自然 打印 形式 。 
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。 如 果 一 个 类 型 实现 Display， 则 标准 库 自 动 为 其 实现 std: :str::ToString 特 型 ， 这 个 特 

型 唯一 的 方法 to_string 有 时 候 比 更 灵活 的 format! 更 方便 : 

// 继续 上 面 的 例子 

assert_eq!(address.to_string(), "fe80::3ea9:f4ff:fe34:7a50"); 
ToString 特 型 出 现 的 时 间 早 于 DitspLay， 而 且 没 那么 灵活 。 对 于 自 定义 类 型 来 说 ， 通 常 
应 该 实现 Display 而 非 ToString。 

。 标准 库 中 的 每 个 公共 类 型 都 实现 了 std::fmt::Debug， 这 个 特 型 可 以 接收 一 个 值 并 将 其 
格式 化 为 在 某 种 程度 上 对 程序 员 有 帮助 的 字符 串 形式 。 使 用 Debug 生成 字符 串 最 简单 的 
方法 就 是 借助 format! 宏 的 {:?} 格式 说 明 符 : 

// 继续 上 面 的 例子 
Let addresses = vec![address, 
IpAddr: :from_str("192.168.0.1")?]; 
assert_ eq!(format!("{:?}", addresses), 
"[v6(fe80::3ea9:f4ff:fe34:7a50), V4(192.168.0.1)]"); 
这 里 利用 了 Vec<T> 在 T 实现 Debug 的 情况 下 对 Debug 的 包装 实现 。Rust 的 所 有 集合 类 
型 都 有 这 种 实现 。 
自 定义 类 型 也 应 该 实现 Debug。 通 常 ， 最 好 是 让 Rust 派 生 一 个 实现 ， 就 像 下 面 这 个 Complex 
类 型 一 样 : 
#[derive(Copy, Clone, Debug)] 
struct Complex { r: f64, i: f64 } 
Display 和 Debug 格式 化 特 型 只 是 format! 宏 及 其 将 值 格式 化 为 文本 的 众多 示例 中 的 两 个 。 
17.4 节 将 介绍 其 他 特 型 以 及 如 何 实现 它们 。 


17.3.13 ”作为 其 他 类 文本 类 型 借用 

可 以 通过 以 下 两 种 方法 借用 切片 的 内 容 。 

。 切片 和 String 实现 了 AsRef<str>、AsRef<[u8]>、AsRef<Path> 和 AsRef<0sStr>。 很 多 标 
准 库 函数 使 用 这 些 特 型 作为 自己 参数 类 型 的 绑 定 ， 因 此 可 以 直接 将 切片 或 字符 串 传 给 它 
们 ， 即 使 这 些 函 数 需要 的 是 其 他 类 型 。 关 于 这 些 特 型 的 详细 解释 ， 参 见 13.7 节 。 

。 切片 和 String 也 实现 了 std::borrow::Borrow<str> 特 型 。HashMap 和 BTreeMap 使 用 
Borrow 让 String 可 以 作为 表 中 的 键 。 详 细 内 容 参见 13.8 节 。 


17.3.14 ”访问 UTF-8 格 式 的 文本 

获取 字 节 表示 的 文本 有 两 种 主要 方式 ， 这 取决 于 你 是 想 取得 字 节 的 所 有 权 ， 还 是 仅仅 想 借 

用 它们 。 

。 slice.as_bytes() 借用 slice 的 字 节 作为 &[u8]。 因 为 这 不 是 一 个 可 修改 引用 ， 所 以 
slice 可 以 假设 其 字 节 会 保持 为 格式 良好 的 UTF-8。 































































































夺 串 与 文本 | 333 


特 
洁 


string.into_bytes() 取得 string 的 所 有 权 并 按 值 返 回 这 个 字符 串 字 节 的 Vec<u8>。 这 
个 转换 代价 很 小 ， 因 为 它 只 是 把 字符 串 用 作 缓 冲 区 的 Vec<u8> 转 了 一 道 手 。 由 于 string 
不 再 存在 ， 因 此 获取 的 字 节 没 必 要 再 是 格式 良好 的 UTF-8， 调 用 者 可 以 按照 自己 的 需要 


修改 这 个 Vec<u8>。 




















ey 








17.3.15 ”从 UTF-8 数 据 产生 文本 


如 果 有 一 段 包 含 UTF-8 数据 的 字 市 值 ， 那 么 根据 如 何 处 理 错误 ， 有 以 下 儿 种 方式 可 以 将 其 




















转换 为 String 或 切片 。 


str::from_utf8(byte_slice) 接收 一 个 &[u8] 字 节 切片 ， 返 回 一 个 ResuLt: 如 果 byte_ 
slice 包含 格式 良好 的 UTF-8， 则 返回 Ok(&str)， 否 则 返回 错误 。 

String: :from_utf8(vec) 尝试 基于 传 入 的 Vec<u8> 值 构建 一 个 字符 串 。 如 果 vec 保存 着 
格式 展 好 的 UTF-8，from_utf8 就 返回 Ok(string)， 其 中 string 是 取得 vec 所 有 权 并 将 
其 作为 缓冲 的 字符 串 。 这 个 过 程 不 涉及 分 配 堆 内 存 或 文本 复制 。 














如 果 字 市 不 是 格式 良好 的 UTF-8， 则 这 个 方法 返回 Err(e)， 甚 中 e 是 一 个 FromUtf8Error 
错误 值 。 此 时 调用 e.into_bytes() 会 得 到 原始 的 向 量 vec， 即 转换 失败 不 会 丢失 值 : 











Let good_utf8: Vec<u8> = vec![0xe9，0x8c，0x86]; 
assert_eq!(String: :from_utf8(good_utf8) .ok()，Some(" 铺 ".to_string())); 


Let bad_utf8: Vec<u8> = vec![0x9f，0xf0，0xa6，0x80]; 
Let result = String: :from_utf8(bad_utf8 ) ; 
assert!(resutLt.is_err()); 
// 因为 String: :from_utf8 失 败 ， 所 以 它 并 未 消费 原始 的 向 量 ， 
// 通过 错误 值 可 以 再 拿 回 未 受 影响 的 向 量 
assert eq!(result.unwrap_err().into_bytes(), 

vec! [QOx9f, Oxf0O, Oxa6, Ox80]); 




















String::from_utf8_lossy(byte_slice) 尝试 基于 字 节 的 共享 切片 &[u8] 构建 一 个 String 
或 &str。 这 个 转换 一 定 会 成 功 ， 格 式 不 正确 的 UTF-8 会 被 Unicode 替换 字符 取代 。 返 回 
的 值 是 一 个 Cow<str>。 如 果 byte_slice 包含 格式 良好 的 UTF-8，Cow<str> 就 直接 从 byte_ 
slice 借用 一 个 &str; 如 果 byte_slice 包含 格式 不 正确 的 UTF-8，Cow<str> 就 拥有 一 个 新 
分 配 的 String， 格 式 不 正确 的 字 节 会 被 标 换 字符 取代 。 因 此 ，byte_stLice 如 果 包 含 格式 
良好 的 UTF-8， 就 不 会 发 生 堆 内 存 分 配 或 复制 操作 。 下 一 节 将 详细 谈论 Cow<str>。 

如 果 你 知道 vec<u8> 包含 格式 良好 的 UTF-8， 就 可 以 调用 不 安全 的 函数 String: :from_ 
utf8_unchecked。 这 个 方法 会 简单 地 将 Vec<u8> 包装 为 一 个 String 并 返回 它 ， 根 本 不 
检查 字 节 的 格式 。 换 名 话说 ， 调 用 这 个 方法 的 前 提 是 你 有 责任 确保 没有 将 格式 错误 的 
UTF-8 引入 系统 ， 这 就 是 这 个 国 数 被 标记 为 unsafe 的 原因 。 

类 似 地 ，str::from_utf8_unchecked 接收 一 个 &[u8] 并 将 其 返回 为 一 个 &str， 同 样 不 检 
查 字 节 的 格式 是 不 是 格式 良好 的 UTF-8。 与 String: :from_utf8_unchecked 一 样 ， 你 有 
责任 确保 这 个 转换 是 安全 的 。 









































17.3.16 ”阻止 分 配 
假设 你 想 写 一 个 问候 用 户 的 程序 。 在 Unix 上 ， 可 以 这 样 写 : 


fn get_name() -> String { 
std: :env: :var("USER") // Windows 使 用 "USERNAME" 
.UNwrap_or("whoever you are" .to_string()) 








} 
println!("Greetings, {}!", get_name()); 


对 Unix 用 户 而 言 ， 这 个 程序 会 按照 用 户 名 问候 他 们 。 而 对 Windows 用 户 而 言 ， 这 样 拿 不 
到 用 户 名 ， 因 此 其 提供 了 一 个 后 备 文本 。 

std: :env: :Var 函数 返回 一 个 String， 当 然 很 可 能 不 会 返回 用 户 名 。 这 就 意味 着 后 备 文本 
必须 也 作为 String 返回 。 让 人 不 满意 的 是 ，get_name 在 返回 静态 字符 串 时 ， 根 本 不 应 该 有 
内 存 分 配 。 


问题 的 核心 在 于 有 时 候 get_name() 返回 的 值 可 能 是 所 有 型 的 String， 有 时候 也 可 能 是 
& static str'。 到 底 是 哪 一 个 ， 只 有 到 运行 程序 的 时 候 才 知道 。 这 种 动态 的 特点 提示 我 们 
可 以 考虑 使 用 std: :borrow: :Cow， 这 个 “ 写 时 克隆 ”类 型 既 可 以 保存 所 有 型 数据 ， 也 可 以 
保存 借用 的 数据 。 


正如 13.11 节 所 解释 的 ，Cow<'a，T> 是 一 个 枚 举 ， 其 包含 两 个 变 体 : Borrowed 和 Owned。 
Borrowed 保存 一 个 引用 & a T，0Owned 保存 &T 的 所 有 型 版 本 : 对 &str 是 String， 对 &[i32] 
是 vec<i32>， 等 等 。 无 论 是 Borrowed 还 是 Oowned，Cow<'a，T> 始终 可 以 生成 一 个 &T 供 你 使 
用 。 事 实 上 ，Cow<'a，T> 解 引 用 为 AT， 有 点 像 智 能 指 


像 下 面 这 样 把 get_name 修改 为 返回 Cow: 


use std::borrow::Cow; 





















































fn get name() -> Cow<'static, str> { 
std: :env: :var("USER") 
.map(|v| Cow::Owned(v)) 
.UNwrap_or(Cow: :Borrowed("whoever you are'")) 


} 


如 果 读 取 "USER" 环境 变量 成 功 ， 则 map 将 得 到 的 字符 串 作为 Cow: :0wned 返回 。 如 果 失 败 ， 
unwrap_or 将 其 静态 的 &str 作为 Cow: :Borrowed 返回 。 调 用 代码 不 变 : 


println!("Greetings, {}!", get_name()); 




















只 要 TT 实现 std: :fmt::Display 特 型 ， 显示 Cow<'a，T> 就 会 得 到 与 显示 T 一样 的 结果 。 
Cow 在 可 能 需要 也 可 能 不 需要 修改 你 借用 的 某 个 文本 时 也 很 有 用 。 在 不 需要 修改 的 时 候 ， 
可 以 继续 借用 它 。 而 Cow 这 个 名 字 代表 的 Clone-on-write ( 写 时 克隆 ) 行为 意味 着 也 可 以 根 
据 需 要 返回 一 个 值 的 所 有 型 、 可 修改 的 副本 。Cow 的 to_mut 方法 确保 Cow 是 Cow: :0wned， 
必要 时 会 应 用 值 的 Toowned 实现 ， 然 后 返回 这 个 值 的 可 修改 引用 。 


因此 ， 如 果 你 发 现 有 些 用 户 (不 是 全 部 ) 也 有 称谓 想 被 提 及 ， 那 可 以 这 样 ， 
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fn get title() -> Option<&'static str> { ... } 


let mut name = get_name(); 

if Let Some(title) = get title() { 
name.to_mut().push_str(", "); 
Name.to_mut().push_str(title); 


} 
println!("Greetings, {}!", name); 


这 个 可 能 会 产生 如 下 输出 : 


$ cargo run 
Greetings, jimb, Esq.! 


$ 
网 此 时 如 果 get_name() 返回 一 个 静态 字符 串 ， 而 get_title() 返回 None，Cow 就 
会 携带 个 静态 字符 串 9 一 直到 调用 println!, 这 样 ， 就 做 到 了 代码 很 直观 ， 同时 也 只 工 
必要 时 才 全 分配 内 存 。 


因为 Cow 频繁 用 于 字符 串 ， 所 以 标准 库 为 Cow<'a，str> 提供 了 一 些 特殊 支持 。 比如 ， 它 提 
供 了 来 自 String 和 &str 的 From 和 Into 转换 ， 因 此 get_name 还 可 以 写 得 更 简洁 : 


fn get name() -> Cow<'static, str> { 
std: :env: :var("USER") 
.map(|v| v.into()) 
.Unwrap_or("whoever you are" .into()) 














} 
Cow<'a，str> 也 实现 了 std::ops::Add 和 std::ops::AddAssign， 因 此 给 名 字 添 加 称谓 还 可 
以 这 样 写 ; 


if let Some(title) = get title() { 
name += ", "; 
name += title; 





} 
或 者 ， 由 于 String 可 以 作为 write! 宏 的 目标 ， 因 此 这 样 写 也 行 : 


use std::fmt::Write; 














if let Some(title) = get title() { 
write!(name.to_ mut(), ", {}", title).unwrap(); 


} 
跟 以 前 一 样 ， 除 非 要 修改 cow， 否 则 不 会 分 配 内 存 。 
要 注意 ， 不 是 所 有 Cow<...，str> 都 必须 是 'static。 在 需要 复制 之 前 ， 可 以 一 直 使 用 Cow 
借用 之 前 计算 的 文本 。 
17.3.17 ”字符 串 作为 泛 型 集合 


String 实现 了 std::default::Default 和 std::iter::Extend: default 返回 一 个 空 字 符 串 ， 而 
extend 可 以 向 一 个 字符 串 末 尾 追 加 字符 、 字 符 串 切 片 或 字符 串 。 这 跟 Rust 中 其 他 集合 类 型 
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(比如 vec 和 HashMap) 为 coLLect 和 partition 泛 型 构建 模式 实现 的 特 型 组 合 是 一 样 的 。 


&str 类 型 也 实现 了 Default， 返 回 一 个 空 切片 。 这 在 某 些 边界 情况 下 很 有 有 用。 比如， 这样 
就 可 以 为 包含 字符 串 切片 的 结构 派生 Defautt。 


17.4 格式 化 值 


本 书 中 很 多 示例 用 到 了 文本 格式 化 宏 ， 比 如 println!: 
println!("{:.3}us: relocated {} at {:#x} to {:#x}, {} bytes", 


0.84391, "object", 
140737488346304_usize, 6299664 usize, 64); 


以 上 调用 会 生成 如 下 输出 : 
0.844bhs: relocated object at 0x7fffffffdcc9 to 0x602010，64 bytes 

这 里 的 字符 串 字 面 量 充当 输出 的 模板 。 模 板 中 的 每 个 {...} 都 会 被 后 面 某 个 参数 的 格式 化 
形式 所 取代 。 模 板 字 符 串 必须 是 常量 ， 这 样 Rust 就 可 以 在 编译 时 根据 参数 类 型 检查 它 。 每 
个 参数 必须 都 用 上 ， 否 则 Rust 会 报 编译 时 错误 。 
有 几 个 标准 库 特 性 中 都 用 到 了 这 种 模板 语言 来 格式 化 字符 串 : 

format! 宏 使 用 模板 来 构建 String; 
。 println! 和 print! 宏 将 格式 化 后 的 文本 写 入 标准 输出 流 ，; 
。 writeln! 和 write! 宏 将 格式 化 后 的 文本 写 入 指定 输出 流 ， 

panic! 宏 使 用 模板 构建 一 个 (可 能 包含 有 用 信息 的 ) 终止 诈 异 的 表达 式 。 
Rust 的 格式 化 功能 是 开放 式 的。 只 要 实现 std: :fmt 模块 的 格式 化 特 型 ， 就 可 以 扩展 这 些 宏 
以 支持 自 定义 类 型 。 上 此外， 使 用 format_args! 宏和 std::fmt::Arguments 类 型 也 可 以 写 出 
自己 的 支持 格式 化 语言 的 函数 和 宏 。 
格式 化 宏 总 是 借用 对 其 参数 的 共享 3 引用， 不 会 取得 所 有 权 ， 也 不 会 修改 它们 。 
模板 的 {...} 部 分 称 为 格式 化 形 参 ， 形 式 为 {which:how}。which 和 how 都 是 可 选 的 ，{} 用 
的 也 很 多 。 
格式 化 形 参 的 which 部 分 用 于 选择 使 用 模板 后 面 的 哪个 参数 来 填补 当前 位 置 。 可 以 通过 索 
引 或 名 称 来 选择 参数 。 没 有 which 部 分 的 形 参 会 简单 地 从 左 往 右 应 用 参数 。 
格式 化 形 参 的 how 部 分 用 于 指定 如 何 格 式 化 参数 ， 加 多 少 空 白 、 精 度 如 何 、 基 数 多 少 ， 等 
等 。 如 果 有 how， 则 其 前 面 的 冒号 是 必需 的 。 
表 17-3 是 一 些 例子 。 
表 17-3: 格式 化 值 的 例子 
























































模板 字符 串 参数 列表 结 果 

"number of {}: {}" "elephants", 19 "number of elephants: 19" 
"from {1} to {0}" "the grave", "the cradle" "from the cradle to the grave" 
"Ve te} vec![0,1,2,5,12,29] "val 1 2, 35, 12, .29]" 
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模板 字符 串 参数 列表 结 果 

"name = {:?2}" "Nemo" "name = \"Nemo\"" 

"{:8.2} km/s" 11.186 ”11.19 km/s" 

"{:20} {:02x} {:02x}" "adc #42", 105, 42 "adc #42 69 2a" 
"{1:02x} {2:02x} {0}" "adc #42", 105, 42 "69 2a adc #42" 

"{lsb:02x} {msb:02x} finsn}" insn="adc #42", lsb=105, msb=42 "69 2a adc #42" 





如 果 想 让 输出 包 仿 {或} 字符， 那么 可 以 在 模板 中 用 两 个 相应 的 字符 : 


assert eq!(format!("{{a, c}} {{a, b, c}}"), 
"{a, cc} {a, b, c}"); 


17.4.1 格式 化 文本 值 


在 格式 化 &str 或 String (char 被 看 作 只 有 一 个 字符 的 字符 串 ) 这 样 的 文本 类 型 时 ， 形 参 
的 how 部 分 可 以 包含 儿 个 组 件 ， 都 是 可 选 的 。 


。 文本 长 度 限制 。 如 果 参 数 比 这 个 值 长 ，Rust 会 将 参数 截 短 。 如 果 没 有 指定 这 个 值 ，Rust 
则 使 用 完整 的 文本 。 

。 最 小 字段 宽度 。 截 短 之 后 ， 如 果 参 数 比 这 个 值 小 ，Rust 会 在 右 侧 〈 黑 认 ) 填充 空格 ( 默 
认 )， 从 而 让 字段 达到 指定 宽度 。 如 果 省 略 ，Rust 则 不 会 填充 参数 。 

。 对 齐 。 如 果 参 数 需要 填充 空格 以 满足 最 小 字段 宽度 ， 那 么 这 个 值 表示 文本 在 字段 中 应 该 
处 于 什么 位 置 。<、^ 和 > 分 别 把 文本 放 在 开始 、 中 间 和 末尾 。 

。 填充 字符 ， 用 于 填充 过 程 。 如 果 省 略 ，Rust 会 使 用 空格 填充 。 如 果 指 定 了 填充 字符 ， 也 
必须 同时 指定 对 齐 。 


表 174 是 一 些 格式 化 文本 值 的 例子 及 效果 。 全 部 示例 使 用 的 都 是 8 个 字符 的 参数 "bookends"。 
表 17-4: 格式 化 文本 值 



















































































使 用 的 特性 模板 字符 串 结 果 
默认 机 "bookends" 
最 小 字段 宽度 "{:4}" "bookends" 
人 "bookends 
文本 长 度 限 制 "{:.4}" "book" 
"Eral2}" "bookends" 
字段 宽度 及 长 度 限 制 "{:12.20}" "bookends 
"{:4.20}" "bookends" 
"{:4.6}" "booken" 
"{:6.4}" "book " 
左 对 齐 ， 字 段 宽度 "{5<12}" "bookends 
居中 ， 字 段 宽度 人 " bookends " 
右 对 齐 ， 字 段 宽度 2 bookends" 
填充 =， 居 中 ， 字 段 宽 度 "{:=^12}" "==bookends==" 
下 充 *， 右 对 齐 ， 字 段 宽度 ， 长 度 限 制 "{:*>12.4}" "#x#x%wx*#book" 





338 | 第 17 章 














Rust 的 格式 化 对 宽度 的 理解 是 朴素 的 : 它 假设 每 个 字符 占 一 列 ， 不 考虑 组 合 字符 、 半 宽 片 
假名 、 零 宽 空 格 ， 以 及 其 他 与 Unicode 相关 的 乱七八糟 的 东西 。 比 如 : 


assert_ eq!(format!("{:4}", "th\u{e9}"), "th\u{fe9} "); 
assert_eq!(format!("{:4}", "the\u{301}"), "the\u{301}"); 


虽然 Unicode 认为 这 两 个 字符 串 都 相当 于 "thé"， 但 Rust 格式 化 程序 并 不 知道 像 '\u{391}' 
(COMBINING ACUTE ACCENT， 组 合 重音 符 ) 这 样 的 字符 需要 特殊 对 待 。 对 第 一 个 字符 
串 ， 它 会 正确 地 填充 空格 ， 但 对 第 二 个 字符 串 ， 它 认为 已 经 4 列 宽 了 ， 因 此 不 会 再 填充 空 
格 。 虽 然 对 这 个 特例 而 言 ， 好 像 看 起 来 让 Rust 改进 一 下 也 不 难 ， 但 面向 所 有 Unicode 脚本 
的 真正 的 多 语言 文本 格式 化 是 一 项 艰巨 的 工作 。 最 好 是 使 用 基于 平台 的 用 户 界面 工具 ， 或 
者 干脆 生成 HTML 和 CSS 让 Web 浏览 器 去 处 理 。 


除了 &str 和 String 之 外 ， 也 可 以 给 格式 化 宏 传 信 引 用 目标 为 文本 的 智能 指针 类 型 ， 比 如 


Rc<String> 或 Cow<'a，str>。 


由 于 文件 名 路 径 不 一 定 是 格式 良好 的 UTF-8， 因 此 std: :path: :Path 并 非 一 个 文本 化 类 型 ， 
不 能 直接 把 std: :path: :Path 传 给 格式 化 宏 。 不 过 ，Path 的 display 方法 返回 的 值 倒 是 可 
以 按照 平台 相关 的 方式 格式 化 : 


println!("processing file: {}", path.display()); 


17.4.2 ”格式 化 数值 

当 格 式 化 参数 具有 usize 或 f64 这 样 的 数值 类 型 时 ， 形 参 how 的 值 包含 以 下 组 成 部 分 (全 

部 都 是 可 选 的 )。 

。 填充 及 对 齐 。 与 针对 文本 类 型 时 的 用 法 一 样 。 

。 + 字符 表示 始终 显示 数值 的 符号 ， 即 使 参数 是 正 值 。 

。 # 字 符 表 示 要 有 明确 的 基数 前 缀 ， 比 如 0x 或 bb。 参见 下 面 的 “ 记 数 法 ”项 。 

。 0 符号 表示 通过 包含 前 置 的 0 来 满足 最 小 字段 宽度 条 件 (而 不 是 通常 的 填充 方式 )。 

。 最 小 字段 宽度 。 如 果 格 式 化 后 数值 没有 达到 这 个 宽度 ， 那 么 Rust 会 在 左 侧 (默认 ) 填 
充 空格 (默认 )， 以 便 达 到 这 个 宽度 。 

。 浮 点 参数 的 精度 。 告 诉 Rust 应 该 在 小 数 点 后 面 保留 儿 位 数字 。Rust 通过 舍 入 或 补 零 来 
生成 必要 的 小 数位 。 如 果 省 略 这 个 精度 参数 ， 那 么 Rust 会 尽 可 能 用 更 少 的 位 数 来 精准 
表示 数值 。 如 果 参 数 是 整数 ， 则 忽略 这 个 精度 。 

。 记 数 法 。 对 整数 类 型 来 说 ， 可 以 是 表示 二 进 制 的 b、 表 示 八 进 制 的 o 或 表示 十 六 进 制 的 
x 或 X。 如 果 包 含 了 # 字 符 ， 就 表示 使 用 Rust 风格 的 基数 前 弘 0Ob、90o、0x 或 0X。 对 于 
浮 点 数 类 型 来 说 ， 基 数 e 或 E 表 示 科 学 记 数 法 ， 包 括 一 个 规范 化 的 系数 和 e 或 E 表 示 的 
指数 。 如 果 没 有 指定 记 数 法 ， 那 么 Rust 会 按照 十 进 制 来 格式 化 数值 。 


表 17-5 是 格式 化 132 值 1234 的 一 些 示 例 。 































































































表 17-5: 格式 化 数值 






































使 用 的 特性 模板 字符 串 结 果 

默认 "{}" "1234" 

强制 符号 "{:+}" "+1234" 

最 小 字段 宽度 ma ! 1234" 
"{:2}" "1234" 

符号 ， 宽 度 "{:+12}" +1234" 

前 置 零 ， 宽 度 "{:012}" "000000001234" 

符号 ， 前 置 零 ， 宽 度 "{:+012}" "+00000001234" 

左 对 齐 ， 宽 度 "{:<12}" "1234 

居中 ， 宽 度 "{:^12}" " 1234 

右 对 齐 ， 宽 度 "{:>12}" 1234" 

左 对 齐 ， 符 号 ， 宽 度 "{:<+12}" "+1234 

居中 ， 和 符号， 宽度 "{:^+12}" "+1234 

右 对 齐 ， 符号， 宽度 "{:>+12}" lL +1234" 

真 充 =， 居 中 ， 宽 度 Wt tad" 

二 进 制 记 数 法 "{:b}" "10011010010" 

宽度 ， 八 进 制 记 数 法 "{:120}" 2322" 

符号 ， 宽 度 ， 十 六 进 制 记 数 法 "{:+12x}" a" +4d2" 

符号 ， 宽度， 大 写 十 六 进 制 记 数 法 "{:+12X}" 1 +4D2" 

符号 ， 基 数 前 级 ， 宽 度 ， 十 六 进 制 "{:+#12x}" +0x4d2" 

符号 ， 基 数 ， 补 零 ， 宽 度 ， 十 六 进 制 "{:+#012x}" "+0x0000004d2" 
"{:+#06x}" "+0x4d2" 





正如 最 后 两 个 例子 所 示 ， 最 小 字段 宽度 适用 于 整个 数值 、 符 号 、 基 数 前 级 ， 所 有 一 切 。 
负数 始终 带 符号 。 结 果 跟 所 有 “强制 符号 ”的 示例 差不多 。 

在 指定 前 置 零 的 情况 下 ， 对 齐 和 填充 字符 会 被 忽略 ， 因 为 零 会 扩展 数值 以 填充 整个 字段 。 
使 用 参数 1234.5678 可 以 展示 浮 点 数 类 型 的 情况 ， 如 表 17-6 所 示 。 

表 17-6: 格式 化 浮 点 值 











使 用 的 特性 模板 字符 串 结 果 
默认 "1234.5678" 
精度 2 "234,57" 
"{:.6}" "1234.567800" 
最 小 字段 宽度 "12 " 1234.5678" 
宽度 ， 精 度 "en 1234.57" 
"{:12.6}" " 1234.567800" 
前 置 零 ， 宽 度 ， 精 度 "{:012.6}" "01234.567800" 
科学 记 数 法 "{:e}" "1.2345678e3" 
科学 记 数 法 ， 精 度 {3ey "1.235e3" 
科学 记 数 法 ， 宽 度 ， 精 度 "{:12.3e}" " 1.235e3" 
"{:12.3E}" ' 1.235E3" 





17.4.3 格式 化 其 他 类 型 

除了 字符 串 和 数值 ， 还 可 以 对 标准 库 中 的 其 他 几 种 类 型 进行 格式 化 。 

。 错误 类 型 全 部 可 以 直接 格式 化 ， 这 样 就 很 容易 将 它们 包含 在 错误 消息 中 。 每 种 
错误 类 型 都 应 该 实现 std::error::Error 特 型， 该 特 型 扩展 了 默认 的 格式 化 特 型 
std: :fmt::Display。 因 此 ， 任 何 实现 Error 的 类 型 都 是 可 以 格式 化 的 。 

可 以 格式 化 互联 网 协议 地 址 类 型 如 std: :net::IpAddr 和 std: :net::SocketAddr。 
true 和 false 这 两 个 布尔 值 也 可 以 格式 化 ， 尽 管 它们 通常 不 是 直接 呈现 给 最 终 用户 的 最 


佳 字符 串 。 








格式 化 上 述 类 型 时 应 该 使 用 与 格式 化 字符 串 同样 的 形 参 。 长 度 限制 、 字 段 宽 度 和 对 齐 都 没 
问题 。 


17.4.4 ”为 调试 格式 化 值 

为 了 调试 和 输出 日 志 ， 可 以 使 用 格式 为 {:?} 的 形 参 格式 化 任意 Rust 标准 库 中 的 公共 类 型 ， 
应 该 都 能 输出 对 程序 员 有 价值 的 内 容 。 可 以 通过 它 来 检查 向 量 、 切 片 、 元 组 、 散 列表 、 线 
程 等 数 百 种 类 型 。 

比如 ， 编 写 如 下 代码 


use std::collections::HashMap; 

let mut map = HashMap: :new(); 
map.insert("Portland", (45.5237606,-122.6819273)); 
map.insert("Shanghai", (25.0375167, 121.5637)); 
println!("{:?}", map); 


会 输出 : 
{"Shanghai": (25.0375167, 121.5637), "Portland": (45.5237606, -122.6819273)} 
HashMap 和 (f64，f64) 类 型 都 知道 如 何 格式 化 自身 ， 无 须 我 们 操心 。 


如 果 在 格式 化 形 参 中 加 上 # 字符 ，Rust 将 美化 打印 输出 结果 。 把 前 面 的 代码 改 成 printtnl 
("{:#?}"，map) 会 导致 如 下 结果 : 
{ 
"Shanghai": ( 
25.0375167 ， 
121;5637 











)s 

"Portland": ( 
45.5237606 ， 
-122.6819273 
) 

} 


当然 ， 具 体 的 格式 不 能 保证 一 点 不 差 ，Rust 新 版 本 不 排除 调整 的 可 能 。 
如 前 所 述 ， 可 以 使 用 #[derive(Debug)] 语法 让 自 定义 类 型 支持 {:?}: 
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#[derive(Copy, Clone, Debug)] 
struct Complex { r: f64, i: f64 } 


有 了 这 个 定义 ， 就 可 以 使 用 {:?} 格式 打印 Complex 的 值 了 : 
Let third = Complex { r: -0.5, i: f64::sqrt(0.75) }; 
printlnt("{€:2}"s third); 

输出 如 下 : 
Complex { r: -0.5, i: 0.8660254037844386 } 


这 个 输出 对 于 调试 而 言 足够 了 ， 不 过 要 是 { 可 以 用 更 数学 的 格式 把 它们 打印 出 来 就 更 好 
了 ， 比 如 : -0.5 + 0.86602540378443861i。17.4.8 节 将 介绍 怎么 做 到 这 一 点 。 


17.4.5 “为 调试 格式 化 指针 


正常 情况 下 ， 如 果 把 任何 类 型 的 指针 〈 引 用 、Box 或 Rc) 传 给 一 个 格式 化 宏 ， 这 个 宏 都 会 
跟随 指针 并 格式 化 其 引用 目标 ， 指 针 本 身 并 不 重要 。 可 是 ， 为 了 调试 有 时 候 确 实 需要 把 指 
针 打 印 出 来 。 可 以 把 这 个 地 址 当成 对 应 值 的 “名 字 ”， 而 这 个 名 字 在 检查 涉及 循环 和 共享 
的 结构 时 会 很 有 用 。 


{:p} 符号 用 于 将 引用 、Box 和 其 他 类 指针 类 型 格式 化 为 地 址 : 


use std::rc::Rc; 

Let original = Rc::new("mazurka".to_string()); 
let cloned = original.clone(); 

Let impostor = Rc::new("mazurka".to_string()); 



































println!("text: Ey, Es original, cloned, impostor); 

println!("pointers: {:p}, {:p}, {:p}", original, cloned, impostor); 
以 上 代码 输出 为 : 

text: mazurka, mazurka, mazurka 


pointers: 0x7f99af80e000，0x7f99af80e000 ，0x7f99af80e030 
当然 ， 特 定 指针 的 值 每 次 运行 都 会 不 一 样 。 但 即便 如 此 ， 通 过 比较 地 址 也 可 以 清楚 地 知道 
前 两 个 引用 是 同一 个 String， 第 三 个 则 指向 一 个 不 同 的 值 。 


地 址 就 是 一 串 十 六 进 制 值 ， 不 太 好 记 ， 如 果 能 对 人 类 更 友好 就 更 好 了 。 但 不 管 怎样 ，{:p] 
的 输出 总 不 失 为 一 种 简单 快捷 的 方案 。 


17.4.6 通过 索引 或 名 字 引 用 参数 
格式 化 形 参 可 以 显示 选择 它 使 用 的 参数 。 比 如 : 


assert eq!(format!("{1},{0},{2}", "zeroth", "first", "second"), 
"first,zeroth,second"); 


当然 ， 冒 号 后 面 可 以 再 跟 其 他 格式 化 形 参 : 


assert eq!(format!("{2:#06x},{1:b},{0:=>10}", "first", 10, 100), 
"0x0064,1010 ,=====first"); 





























除了 通过 索引 选择 参数 ， 还 可 以 使 用 名 字 。 这 样 可 以 让 包含 较 多 参数 的 复杂 模板 变 得 更 请 
晰 。 比 如 : 


assert eq!(format!("{description:.<25}{quantity:2} @ {price:5.2}", 
price=3.25， 
quantity=3， 
description="Maple Turmeric Latte" ) ， 
"Maple Turmeric Latte..... 3@ 3.25"); 


(这 里 的 命名 参数 类 似 于 Python 中 的 关键 字 参 数 ， 但 这 只 是 格式 化 宏 的 一 种 特殊 特性 ， 
Rust 函数 调用 语法 并 不 支持 。) 
此 外 ， 还 可 以 在 一 个 格式 化 宏 中 混用 索引 、 名 字 和 位 置 ( 既 不 是 索引 也 不 是 名 字 ) 参数 ， 
其 中 ,位置 参数 从 左 往 右 匹 配 ， 但 不 考虑 已 有 的 索引 和 命名 参数 : 

assert_ eq!(format!("{mode} {2} {} {}"， 


"people", "eater", "purple", mode="flying"), 
"flying purple people eater"); 


混合 使 用 时 ， 命 名 参数 必须 放 在 列表 末尾 。 
17.4.7 ”动态 宽度 与 精度 


形 参 的 最 小 字段 宽度 、 文 本 长 度 限制 和 数值 精度 并 不 一 定 是 固定 的 值 ， 而 是 可 以 在 运行 时 
确定 。 
之 前 我 们 看 到 过 像 这 个 表达 式 这 样 的 例子 ， 它 会 让 字符 串 content 在 20 字符 宽 的 字段 中 右 
对 齐 : 
format!("{:>20}", content) 
如 果 想 在 运行 时 确定 字段 宽度 ， 可 以 这 样 写 : 
format!("{:>1$}", content, get width()) 
使 用 1$ 作为 最 小 字段 宽度 是 告诉 format! 使 用 第 二 个 参数 的 值 作 为 宽度 。 引 用 的 参数 必须 
是 usize。 还 可 以 通过 名 字 来 引用 参数 : 
format!("{:>widths}"，content，width=get_width()) 
同样 ， 文 本 长 度 限制 也 可 以 如 法 炮制 ; 


format!("{:>width$. limit$}", content, 
width=get _ width(), limit=get limit()) 


在 文本 长 度 限制 或 浮 点 精度 的 位 置 ， 还 可 以 用 * 表示 要 取得 下 一 个 位 置 上 的 参数 作为 精 
度 。 下 面 的 代码 会 把 content 切 为 最 长 get_limit() 个 字符 : 


format!("{:.*}", get _ limit(), content) 


作为 精度 的 参数 必须 是 usize。 字 段 宽 度 没有 对 应 的 语法 。 
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17.4.8 格式 化 自 定 义 类 型 


格式 化 宏 使 用 std: :fmt 模块 中 定义 的 一 组 特 型 将 值 转换 为 文本 。 只 要 你 自己 实现 其 中 一 个 
或 多 个 特 型 ， 就 可 以 让 Rust 的 格式 化 宏 格 式 化 自 定义 类 型 。 


格式 形 参 的 记号 表示 其 参数 类 型 必须 实现 哪个 特 型 ， 如 表 17-7 所 示 。 
表 17-7: 格式 化 自 定义 类 型 






































记 “号 汪汪 区 特 型 用 途 

无 癸 std: :fmt::Display 文本 、 数 值 、 错 误 : 忽 底 的 特 型 
b {:#b} std: :fmt::Binary 二 进 制 中 的 数值 

0 {:#50} std: :fmt::0ctal 八进制 中 的 数值 

oe {:4x} std: :fmt: :LowerHex 十 六 进 制 中 的 数值 ， 小 写 数字 

x {:016X} std: :fnt: :UpperHex 十 六 进 制 中 的 数值 ， 大 写 数字 

e {: .3e} std: :fmt::LowerExp 科学 记 数 法 中 的 浮 点 数值 

E {3.3E} std: :fmt::UpperExp 同上 , E 大写 

? {:#?} std: :fmt::Debug 调试 视图 ， 适 合 开发 者 

p {:p} std: :fmt::Pointer 指针 地 址 ， 适 合 开发 者 





如 果 把 #[derive(Debug)] 属性 放 在 类 型 定义 上 ， 就 可 以 使 用 {:?} 格式 形 参 。 添 加 这 个 属 
性 就 是 让 Rust 帮 有 你 实现 std: :fmt: :Debug 特 型 。 
格式 化 特 型 的 结构 都 一 样 ， 只 是 名 字 不 同 。 下 面 以 std::fnt: :ptsptay 为 例 来 看 -看 ; 


trait Display { 
fn fmt(&self, dest: &mut std::fmt::Formatter) 
-> std::fmt::Result; 











} 
这 个 fmt 方法 的 任务 就 是 生成 self 的 适当 的 格式 化 表示 ， 并 将 字符 写 人 dest。 除 了 作为 
输出 流 ，dest 参数 也 会 携带 解析 格式 形 参 后 得 到 的 像 对 齐 和 最 小 字段 宽度 这 样 的 细节 。 


比如 ， 本 章 前 面 在 介绍 复数 的 例子 时 曾 提 到 要 是 Complex 值 能 够 以 惯常 的 a + bi 形式 输出 
就 好 了 。 下 面 就 是 为 此 而 对 Display 的 一 个 实现 : 


use std::fmt; 











impl fmt::Display for Complex { 
fn fmt(&self, dest: &mut fmt::Formatter) -> fmt::Result { 
let i sign = if self.i < 0.0{ '-' } else{ '+' }; 
write!(dest, "{} {} {}i", self.r, i_sign, f64::abs(self.i)) 


} 
这 里 利用 了 Formatter 本 身 是 一 个 输出 流 的 事实 ， 因 此 write! 宏 可 以 帮 我 们 做 大 部 分 工 
作 。 有 了 以 上 实现 ， 就 可 以 这 样 写 了 : 

Let one_twenty = Complex { r: -0.5, i: 0.866 }; 


assert eq!(format!("{}", one_twenty), 
"-0.5 + 0.8661"); 





Let two_forty = Complex { r: -0.5, i: -0.866 }; 
assert_ eq!(format!("{}", two_forty), 
"-0.5 - 0.866i"); 


有 了 时候， 可 能 需要 以 极 坐 标 形式 显示 复数 。 比 如 ， 要 在 复 平面 上 从 原点 到 数值 画 一 条 线 ， 
极 坐 标 形式 能 给 出 线 的 长 度 ， 以 及 其 顺 时 针 到 x 轴 正 方向 的 角度 。 格 式 形 参 中 的 # 字 符 通 
常用 于 选择 替代 的 显示 形式 ，Disptay 实现 可 以 将 其 看 作对 使 用 极 坐标 形式 的 一 个 要 求 : 


impl fmt::Display for Complex { 
fn fmt(&self, dest: &mut fmt::Formatter) -> fmt::Result { 
let (r, i) = (self.r, self.i); 
if dest.alternate() { 
Let abs = f64::sqrt(r * r + i * i); 
Let angle = f64::atan2(i, r) / std::f64::consts::PI * 180.0; 
write!(dest, "{} ZL {}°", abs, angle) 























} else { 
let i sign = if i < 0.0{ '-' } else{ '+' }; 
write!(dest, "{} {} {}i", r, i_sign, f64::abs(i)) 
} 
} 
} 
下 面 来 使 用 这 个 实现 : 


let ninety = Complex { r: 0.0, i: 2.0 }; 
assert_eq!(format!("{}", ninety), 

"0 + 2i"); 
assert eq!(format!("{:#}", ninety), 

2 2 90) 


虽然 这 个 格式 化 特 型 的 fmt 方法 返回 fmt::Result 值 (典型 的 模块 特定 的 Result 类 型 )， 
也 应 该 只 在 Formatter 的 操作 上 传播 失败 ， 就 像 前 面 的 fmt: :Display 实现 在 调用 write! 时 
那样 。 你 的 格式 化 函数 绝 不 能 自己 产生 错误 。 这 样 format! 之 类 的 宏 就 可 以 简单 地 返回 一 
个 String 而 不 是 Result<sString，...>， 因 为 给 String 追加 格式 化 文本 永远 不 会 出 错 。 而 
且 这 样 也 能 确保 由 write! 或 writeln! 导致 的 错误 能 够 反映 真正 来 自 底层 IO 流 的 问题 ， 
而 不 是 格式 化 问题 。 


Formatter 还 有 很 多 其 他 的 有 用 的 方法 ， 包 括 用 于 处 理 映 射 、 列 表 等 结构 化 数据 的 方法 。 
这 些 方法 本 书 没 有 涉及 ， 要 了 解 详细 内 容 请 参考 在 线 文档 。 


17.4.9 在 你 的 代码 中 使 用 格式 化 语言 


使 用 Rust 的 format_args! 宏和 std: :fmt::Arguments 类 型 ， 可 以 在 自己 的 代码 中 编写 接收 
格式 化 模板 和 参数 的 函数 和 宏 。 比 如 ， 假 设 你 的 程序 需要 在 运行 的 时 候 记 录 状 态 消息 ， 此 
时 你 希望 利用 Rust 的 文本 格式 化 语言 生成 这 些 消息 。 下 面 就 是 一 个 起 点 : 

fn logging_enabled() -> bool { 


} 























use std::fs::O0penOptions; 
use std::io::Write; 
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fn write_Log_entry(entry: std: :fmt::Arguments) { 
if logging_enabled() { 

// 为 简单 起 见 ， 每 次 只 是 打开 文件 

Let mut log_file = OpenOptions::new() 
.append(true) 
.Create(true) 
.open("log-file-name") 
.expect("failed to open log file"); 





log file.write fmt(entry) 
.expect("failed to write to log"); 
} 
} 


然后 可 以 这 样 调用 write_log_entry: 

write_Log_entry(format_args!("Hark! {:?}\n", mysterious_value)); 
编译 时 ，format_args! 安 会 解析 模板 字符 串 并 按照 参数 类 型 对 其 进行 检查 ， 并 在 发 现 问题 
时 报错 。 运 行 时 ， 它 会 求 值 参数 并 构建 一 个 带 有 所 有 格式 化 文本 必需 信息 的 Arguments 值 ， 
包括 模板 的 预 解析 形式 ， 以 及 对 参数 值 的 共享 引用 。 


构建 Arguments 值 很 省 事 ， 只 是 收集 几 个 指针 而 已 。 此 时 并 不 会 发 生 格式 化 操作 ， 只 是 收 
集 后 面 格式 化 时 所 需 的 信息 。 这 一 点 很 重要 : 如 果 不 启 用 打印 日 志 ， 那么 花 在 转换 数值 为 
十 进 制 、 填 充值 等 上 面 的 时 间 都 是 浪费 的 。 


File 类 型 实现 了 std::io::Write 特 型 ， 其 write_fmt 方法 接收 Argument 参数 并 进行 格式 
化 。 之 后 再 把 结果 写 入 底层 流 。 
调用 write_log_entry 的 代码 并 不 好 看 。 此 时 就 可 以 用 上 宏 了 : 


macro_rules! log { // 宏 定 义 的 名 字 后 面 不 需要 加 叹 号 | 
($format:tt, $($arg:expr),*) => ( 
write_log_entry(format_args!($format, $($arg),*)) 





























) 
} 


第 20 章 会 详细 介绍 宏 。 现 在 ， 只 要 知道 它 定义 了 一 个 新 的 tog! 宏 ， 而 这 个 宏 会 把 它 的 参 
数 传 给 format_args!， 并 对 得 到 的 结果 Arguments 值 再 调用 write entry 图 数 就 行 了 。 
println!、writeln! 和 format! 等 格式 化 宏 的 实现 也 都 差不多 。 

现在 就 可 以 这 样 使 用 Log! 安 了 : 


log!("0 day and night, but this is wondrous strange! {:?}\n", 
mysterious_value); 


是 不 是 觉得 好 一 点 了 ? 


17.5 正则 表达 式 


外 部 的 regex 包 是 Rust 官方 的 正则 表达 式 库 ， 其 提供 了 常用 的 搜索 和 匹配 功能 。 这 个 库 对 
Unicode 提供 了 完善 的 支持 ， 但 也 可 以 搜索 字 节 字符 串 。 虽 然 不 支持 其 他 正则 表达 式 包 中 
的 某 些 特性 〈 比 如 反 向 引用 和 前 后 看 模式 ) ， 但 这 些 简 化 允许 regex 确保 搜索 时 间 在 表达 式 
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大 小 和 被 搜索 文本 的 长 度 上 呈 线 性 关系 。 此 外 ， 还 可 以 确保 即使 用 不 受信 任 的 表达 式 搜索 
不 受信 任 的 文本 ，regex 也 是 安全 的 。 


本 书 将 对 regex 做 一 些 简 单 介 绍 ， 详 细 信 息 请 参考 在 线 文档 。 


尽管 regex 包 不 在 std 里 ， 但 它 仍然 是 由 负责 std 的 Rust 库 团 队 维护 的 。 要 使 用 regex， 
需要 在 包 的 Cargo.toml 文件 的 [dependencies] 部 分 添加 一 行 代码 : 


regex = "1" 


然后 在 包 的 底层 加 一 个 extern crate 特性 项 : 


extern crate regex; 


下 面 儿 市 假设 已 经 完成 了 这 些 准备 。 


17.5.1 基本 用 法 


Regex 值 表示 解析 之 后 的 正则 表达 式 ， 随 时 可 用 。Regex: :new 构造 函数 会 将 传 入 的 &str 作 
为 正则 表达 式 来 解析 ， 返 回 Result: 


use regex::Regex; 

















// semver 版 本 号 ， 比 如 0.2.1 

// 可 能 包含 预 发 布 版 本 后 级 ， 比 如 9 .2.1-alpha 

/ (为 简单 起 见 ， 不 考虑 构建 元 数据 后 绥 ) 

// 

// 注意 ， 使 用 r"..… "原始 字符 串 语法 可 以 避免 过 多 反 斜 村 
let semver = Regex::new(r"(\d+)\.(\d+)\.C(\d+)(-[-.[:alnum: ]]*)?")?; 


// 简单 搜索 ， 返 回 布尔 值 结果 
let haystack = r#"regex = "0.2.5""#; 
assert!(semver.is match(haystack)); 


Regex: :captures 方法 从 字符 串 中 搜索 第 一 个 匹配 ， 返 回 的 regex: :Captures 值 包含 正则 表 
达 式 中 每 一 组 对 应 的 匹配 信息 : 


// 可 以 读 取 捕 获 组 : 

let captures = semver .captures(haystack) 
.Ok_or("semver regex should have matched")?; 

assert_ eq!(&captures[0], "0.2.5"); 

assert_eq!(&captures[1], "0"); 

assert eq!(&captures[2], "2"); 

assert_eq!(&captures[3], "5"); 


如 果 相 应 的 捕获 组 没有 匹配 ， 则 访问 Captures 值 的 对 应 索引 会 导致 诈 异 。 要 测试 某 个 特定 
组 是 否 有 匹配 结果 ， 可 以 调用 Captures: :get， 它 会 返回 0ption<regex: :Match>。Match 值 
记录 一 个 捕获 组 的 匹配 信息 : 

assert_eq!(captures.get(4), None); 

assert_eq!(captures.get(3).unwrap().start(), 13); 


assert_eq!(captures.get(3).unwrap().end(), 14); 
assert_eq!(captures.get(3).unwrap().as_str(), "5"); 





















































夺 串 与 文本 | 347 


导 
洁 


可 以 遍历 一 个 字符 串 中 的 所 有 匹配 : 


Let haystack = "In the beginning, there was 1.0.0. \ 
For a while, we used 1.0.1-beta, \ 
but in the end, we settled on 1.2.4."; 


let matches: Vec<&str> = semver.find iter(haystack) 
.map(|match_| match_.as_str()) 
.collect(); 
assert eq!(matches, vec!["1.0.0", "1.0.1-beta", "1.2.4"]); 
迭代 器 find_iter 会 为 表达 式 的 每 个 不 重 倒 匹配 分 别 生成 一 个 Match 值 ， 从 字符 串 开 头 到 末 
尾 。captures_iter 方法 也 类 似 ， 只 不 过 生成 的 是 记录 所 有 捕获 组 的 Captures 值 。 由 于 记录 
捕获 组 会 导致 搜索 变 慢 ， 因 此 如 果 不 需 要 捕获 组 信息 ， 那 么 最 好 使 用 不 返回 它们 的 方法 。 


17.5.2 ” 懒 构建 Regex 值 

Regex: :new 构造 函数 的 开销 可 能 很 大 ， 在 配置 比较 高 的 开发 机 上 为 1200 字符 的 正则 表达 
式 构 建 Regex 会 花 1 毫秒 时 间 ， 随 随便 便 一 个 表达 式 也 要 占用 几 微 秒 。 为 此 ， 最 好 不 要 在 
大 计算 量 的 循环 中 构建 Regex， 而 是 只 构建 Regex 一 次 ， 然 后 重用 它 。 

lazy_static 包 提供 了 首次 使 用 时 懒 构建 静态 值 的 优雅 方式 。 要 使 用 它 ， 记 住 在 Cargo.toml 
文件 中 加 上 : 


[dependencies] 
lazy_static = "1.4.0" 


这 个 包 提 供 了 声明 这 种 变量 的 宏 : 
#[macro_use] 
extern crate lazy_static; 






































lazy_static! { 
static ref SEMVER: Regex 
= Regex: :new(r"(\d+)\.(\d+t)\.C\d+t)(-[-.[:alnum: ]]*)?") 
.expect("error parsing regex"); 

} 
这 个 宏 会 扩展 为 名 为 SEMVER 的 一 个 静态 变量 声明 ， 不 过 其 类 型 并 不 是 Regex。 这 个 变量 的 
类 型 是 由 宏 生 成 的 并 且 实 现 了 Deref<Target=Regex>， 因 此 暴露 了 与 Regex 完全 相同 的 方法 。 
首次 解 引 用 SEMVER 时 ， 会 运行 初始 化 程序 ， 然 后 得 到 的 值 被 保存 起 来 供 后 面 使 用 。 因 为 
SEMVER 是 一 个 静态 变量 ， 而 不 是 局 部 变量 ， 所 以 每 个 程序 执行 最 多 运行 一 次 初始 化 程序 。 


有 了 上 面 的 声明 ， 使 用 SEMVER 也 很 简单 : 


use std::io::BufRead; 




















Let stdin = std::io::stdin(); 
for line in stdin.lock().lines() { 
let line = line?; 
if let Some(match_) = SEMVER.find(&line) { 
println!("{}", match_.as_str()); 





} 
} 
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可 以 把 lazy_static! 声明 放 到 一 个 模块 中 ， 甚 至 放 到 一 个 使 用 Regex 的 函数 内 部 ， 只 要 作 
用 域 合适 就 没 问 题 。 无 论 放 在 哪里 ， 正 则 表达 式 都 只 会 在 程序 运行 时 编译 一 次 。 


17.6 规范 化 


对 于 “ 茶 ” 的 法 语 thé， 很 多 人 会 认为 它 包 含 3 个 字符 。 然 而 ，Unicode 实际 上 有 两 种 方式 
表示 这 个 词 。 
。 在 组 合 (composed) 形式 中 ，thé 包含 3 个 字符 : 't'、'h' 和 'é'， 其 中 '6' 是 一 个 码 
点 为 0xe9 的 Unicode 字符 。 
。 在 分 解 (decomposed) 形式 中 , thé 包含 4 个 字符 : 't'、'h'、'e' 和 '\u{301}', 其 
是 ASCI 字符 ， 没 有 重音 符 ， 而 码 点 bx301 是 “组 合 重音 符 ”(COMBINING ACUTE 
ACCENT)， 它 会 给 前 面 的 任意 字符 加 上 重音 符号 。 
对 Unicode 而 言 ,《 的 组 合 形式 或 分 解 形式 并 无 对 错 之 分 ， 相 反 它 们 是 等 价 的 ， 因 为 表示 
的 是 同一 个 抽象 字符 。Unicode 要 求 两 种 形式 都 应 该 以 相同 的 方式 显示 ， 输 入 法 则 被 允许 
生成 任意 形式 ， 结 果 用 户 大 都 不 知道 自己 会 看 到 或 者 应 该 输入 哪 种 形式 。(Rust 支持 在 字 
符 串 字面 量 中 直接 使 用 Unicode 字符 ， 因 此 如 果 你 不 在 乎 编码 ， 那 么 可 以 直接 使 用 "theé"。 
为 了 清晰 起 见 ， 此 处 将 使 用 \u 转 义 。) 
然而 ， 作 为 Rust 的 &str 或 String 值 ，"th\ufe9}" 和 "the\u{391}" 根本 不 是 一 回 事 。 它 们 
有 不 同 的 长 度 ， 比 较 起 来 不 相等 ， 有 不 同 的 散 列 值 ， 并 且 顺 序 也 与 其 他 字符 串 不 同 : 


assert!("th\u{e9}" != "the\u{301}"); 
assert!("th\u{e9}" > "the\u{301}"); 
































二 
, 


// 散 列 程序 需要 积累 一 系列 值 的 散 列 ， 因 此 计算 1 的 散 列 会 显得 很 笨 寻 
use std::hash::{Hash, Hasher}; 
use std::collections::hash_map::DefaultHasher; 
fn hash<T: ?Sized + Hash>(t: &T) -> u64 { 
let mut s = DefaultHasher::new(); 
t.hash(&mut s); 
s.finish() 














} 


// 在 将 来 的 Rust 版 本 中 ， 这 些 值 可 能 会 不 一 样 
assert_eq!(hash("th\u{e9}"), 0x53e2d0734eb1dff3 ) ; 
assert_eq!(hash("the\u{301}"), Ox90d837f0a0928144); 


明确 一 下 ， 如 果 你 想 比较 用 户 提供 的 文本 ， 或 者 将 其 用 作 散 列表 或 B 树 中 的 键 ， 那 应 该 先 
把 每 个 字符 串 转换 成 某 种 规范 的 形式 。 

好 在 Unicode 规定 了 字符 串 的 规范 化 形式 。 如 果 两 个 字符 串 按照 Unicode 的 规则 应 该 判定 
为 等 价 ， 那 么 它们 规范 化 的 形式 应 该 每 个 字符 都 相同 。 在 以 UTF-8 编码 的 情况 下 ， 就 是 
每 个 字 节 都 相同 。 这 意味 着 可 以 使 用 == 来 比较 规范 化 的 字符 串 、 将 它们 作为 Hashap 或 
Hashset 的 键 ， 等 等 。 如 此 就 能 享受 Unicode 的 平等 了 。 


不 进行 规范 化 有 时 候 会 导致 安全 隐患 。 比 如 ， 如 果 你 的 网 站 对 用 户 名 在 有 些 情况 下 进行 了 
规范 化 ， 而 在 另 一 些 情况 下 没有 进行 规范 化 ， 那 么 就 可 能 出 现 两 个 名 为 bananasflambé 的 
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不 同 用 户 。 对 这 两 个 用 户 ， 你 的 一 些 代码 会 认为 是 一 个 人 ， 而 另 一 些 代码 会 认为 是 两 个 
人 ， 最 终 导致 用 户 利益 受 损 。 当 然 ， 有 很 多 方法 能 够 避免 这 种 问题 ， 但 历史 表明 ， 也 有 很 
多 方法 不 能 避免 。 


17.6.1 规范 化 形式 

Unicode 定义 了 4 种 规范 化 形式 ， 每 一 种 都 适用 于 不 同 用 途 。 为 此 ， 需 要 回答 两 个 问题 。 
第 一 ， 你 倾向 于 字符 尽 可 能 组 合 ， 还 是 分 解 ? 
比如 ， 越 南 语 Ph6 最 常用 的 组 合 表示 形式 是 3 个 字符 的 字符 串 "Ph\u{1def}"， 这 种 
情况 下 ， 音 调 记 号 "和 元 音 记 号 ”在 一 个 Unicode 字符 上 都 应 用 给 了 基本 字符 o， 即 
'\u{ledf}'， 这 个 字符 的 Unicode 名 字 叫 "LATIN SMALL LETTER O WITH HORN 
AND HOOK ABOVE”( 上 带 角 号 和 钩 号 的 小 写 拉丁 字母 0)。 
最 常用 的 分 解 表示 形式 就 是 把 基本 字符 跟 它 的 两 个 记号 分 开 表 示 成 3 个 独立 的 Unicode 
字符 : 'o'、'\u{31b}' (COMBINING HORN, 组 合 角 号 ) 和 '\u{309}' (COMBINING 
HOOK ABOVE, 组 合 上 钓 号 )。 最 终结 果 是 "Pho\u{31b}\u{399}"。( 任 何 时 候 ， 只 要 组 
合 记 号 以 独立 字符 出 现 ， 而 不 是 作为 组 合 字符 的 一 部 分 ， 所 有 规范 化 形式 都 会 规定 它们 
出 现 的 先后 次 序 。 因 此 就 算 字 符 有 多 个 发 音 记 号 ， 其 规范 化 形式 都 是 有 完善 定义 的 。) 
组 合 形式 的 兼容 性 问题 通常 较 少 ， 因 为 它 最 接近 大 多 数 语 言 在 Unicode 之 前 就 有 的 自然 
表现 形式 。 而 且 ， 可 能 也 更 适合 Rust 的 format! 宏 之 类 的 简单 字符 串 格 式 化 特性 。 另 
一 方面 ， 分 解 形式 则 可 能 更 适合 显示 文本 或 搜索 ， 因 为 它 能 呈现 出 文本 的 所 有 细节 。 
第 二 ， 如 果 两 个 字符 序列 表示 相同 的 基础 文本 ,但 在 该 文本 格式 化 上 有 差异 ， 那 么 你 倾 
向 于 认为 它们 等 价 ， 还 是 不 同 ? 
Unicode 对 数字 '5' 及 其 上 标 形式 '， (或 "\u{2675}' ) 、 圆 圈 形 式 ' @ ' (或 ，\uf2464} ' ) 
都 有 单独 的 字符 ， 但 声明 这 3 个 字符 “兼容 性 等 效 ”(compatibility equivalent) 。 类 似 地 ， 
Unicode 专门 有 一 个 字符 表示 历 的 连 字 形式 〈'\uffb93}' ) ， 但 又 声明 这 个 字符 与 3 个 字 
符 的 序列 "ffi" 兼容 性 等 效 。 
兼容 性 等 效 对 搜索 而 言 是 有 意义 的 。 比 如 ， 搜 索 只 包含 ASCI 字符 的 "difficuLt"， 也 
应 该 匹配 使 用 矿 连 字 的 字符 串 "di\u{fb93}cult"。 基 于 兼容 性 对 后 一 字符 串 进行 分 解 ， 
把 连 字 替换 成 3 个 字母 "ffi"， 可 以 让 搜索 变 得 更 容易 。 但 将 文本 规范 化 为 兼容 性 等 效 
形式 有 可 能 丢失 重要 信息 ， 因 此 不 可 和 鲁 三 行事 。 比 如 ， 多 数 情况 下 把 "25" 保存 为 "25" 
是 错误 的 。 

Unicode NFC (Normalization Form C， 规 范 化 形式 C) 和 NFD (Normalization Form D， 规 

范 化 形式 D) 对 每 个 字符 分 别 应 用 最 大 化 组 合 和 最 大 化 分 解 的 策略 ， 但 不 会 尝试 统一 兼容 

性 等 效 序列 。NFKC 和 NFKD 规范 化 形式 与 NFC 和 NFD 类 似 ， 但 会 将 所 有 兼容 性 等 效 序 

列 规范 化 为 各 自 的 某 种 简单 表示 。 

W3C (World Wide Web Consortium ， 万 维 网 联盟 ) 的 “Character Model For the World Wide 

Web” 推 荐 对 所 有 内 容 使 用 NFC。Unicode 的 “Identifier and Pattern Syntax” 附 录 建 议 对 编 

程 语 言 的 标识 符 使 用 NFKC， 并 给 出 了 必要 时 修改 该 形式 的 规则 。 
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17.6.2 unicode-normaLization 包 


Rust 的 unicode-normalization 包 提 供 了 一 个 特 型 ， 该 特 型 可 以 给 &str 添加 把 文本 转换 为 
任意 4 种 规范 化 形式 的 方法 。 要 使 用 这 个 包 ， 先 在 Cargo.toml 文件 的 [dependencies] 部 分 
加 上 下 面 这 行 代码 : 


unicode-normalization = "0.1.8" 
包 的 顶部 文件 还 要 添加 extern crate 声明 : 


extern crate unicode normalization; 


有 了 上 面 的 声明 之 后 ，&str 就 拥有 了 4 个 新 方法 ， 它 们 都 返回 字符 串 的 对 应 规范 化 形式 的 
迭代 器 : 


use unicode normalization::UnicodeNormalization; 























// 无 论 左边 的 字符 串 是 哪 种 表示 形式 (不 能 只 赁 眼睛 看 ) ,这些 断言 都 成 立 

// these assertions will hold. 

assert eq!("PhoO'".nfd().collect::<String>(), "Pho\u{31b}\u{309}"); 
assert_eq!("Ph@O".nfc().collect::<String>(), "Ph\u{1ledf}"); 

// 这 里 左边 使 用 的 是 "ffi" 连 字符 

assert_eq!("@ Di\u{fb03}culty".nfkc().collect::<String>(), "1 Difficulty"); 


把 规范 化 之 后 的 字符 串 再 次 进行 相同 形式 的 规范 化 会 得 到 相同 的 文本 。 

虽然 规范 化 字符 串 的 任意 子 字符 串 本 身 是 规范 化 的 ， 但 两 个 规范 化 的 字符 串 拼 接 起 来 未 必 
是 规范 化 的 。 比 如 ， 第 二 个 字符 串 以 组 合 字符 开头 ， 而 对 于 第 一 个 字符 串 而 言 ， 这 个 组 合 
字符 应 该 放 在 它 的 最 后 一 个 组 合 字 符 前 玫 
Unicode 保证 ， 只 要 文本 在 规范 化 时 没有 使 用 未 分 配 的 码 点 ， 那 其 规范 化 形式 在 标准 的 未 
来 版 本 中 就 不 会 变 。 这 意味 着 规范 化 形式 通常 适合 持久 存储 ， 而 不 会 受 Unicode 标准 演进 
的 影响 。 
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杜 利 特 尔 : 你 有 什么 证 据 能 证 明 你 的 存在 ? 

炸弹 20 号 ， 咽 …… 好 吧 …… 我 思 ， 故 我 在 。 

杜 利 特 尔 : 很 好 ， 非 常 好 。 但 是 你 又 如 何 知道 其 他 东西 是 存在 的 呢 ? 
炸弹 20 号 : 我 的 传感器 传达 给 我 的 。 





奇幻 动画 《 黑 星 》 (Dark Star) 

Rust 标准 库 针 对 输入 和 输出 的 特性 是 通过 3 个 特 型 ， 即 Read、BufRead 和 Write， 以 及 实 

现 它们 的 各 种 类 型 暴露 出 来 的 。 

。 实现 Read 的 值 有 读 取 字 节 输 入 的 方法 ， 这 些 值 叫 读 取 器 (reader) 。 

。 实现 BufRead 的 值 是 缓冲 读 取 器 ， 其 支持 Read 的 所 有 方法 ， 额 外 又 支持 读 取 文本 行 等 
的 方法 。 

。 实现 write 的 值 既 支持 字 节 输出 也 支持 UTF-8 文本 输出 ， 这 些 值 叫 写 入 器 (writer)。 

图 18-1 展示 了 这 3 个 特 型 以 及 几 个 读 取 器 和 写 人 器 类 型 的 示例 。 



































Cursor<&[u8]> 
StdinLock 











图 18-1: Rust 标准 库 中 的 部 分 读 取 器 和 写 入 器 类 型 
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本 章 将 介绍 如 何 使 用 这 些 特 型 和 它们 的 方法 、 实 现 它 们 的 类 型 ， 以 及 其 他 与 文件 、 终 端 和 
网 络 交互 的 方式 。 


18.1 读 取 器 和 写 入 器 


读 取 器 是 一 种 值 ， 我 们 的 程序 可 以 通过 它 读 取 字 闻 ， 主 要 有 以 下 例子 。 


。 使 用 std::fs::File::open(filename) 打开 的 文件 。 

。 用 于 从 网 络 接收 数据 的 std: :net::TcpStream。 

。 用 于 从 进程 的 标准 输入 流 读 取 数 据 的 std: :io: :stdin()。 

。 std::io::Cursor<&[u8]> 值 ， 这 是 一 种 从 内 存 的 字 节 数组 中 “ 读 取 ”数据 的 读 取 器 。 


写 入 器 也 是 一 种 值 ， 我 们 的 程序 可 以 通过 它 写 入 字 节 ， 主 要 有 以 下 例子 。 


。 使 用 std::fs::File::create(filename) 打开 的 文件 。 
。 用 于 通过 网 络 发 送 数据 的 std: :net::TcpStream。 

。 用 于 将 数据 写 入 终端 的 std: :io: :stdout() 和 std::ito:stderr()。 

。 std::io::Cursor<&mut [u8]> 值 ， 此 值 允 许 将 任何 可 修改 字 节 切片 作为 文件 写 入 。 
。 Vec<u8> 也 是 一 个 写 和 器， 其 write 方法 可 以 为 向 量 追 加 元 素 。 


因为 读 取 器 和 写 入 器 都 有 标准 的 特 型 (std: :to::Read 和 std: :io::nrite)， 所 以 常见 的 做 
法 是 编写 泛 型 代码 ， 以 涵盖 各 种 输入 和 输出 渠道 。 例 如 ， 下 面 这 个 函数 可 以 从 任何 读 取 器 
将 全 部 字 市 复制 到 任何 写 入 器 : 


use std::io::{self, Read, Write, ErrorKind}; 



































const DEFAULT_BUF_SIZE: usize = 8 * 1024; 


pub fn copy<R: ?Sized, W: ?Sized>(reader: &mut R, writer: &mut W) 
-> io::Result<u64> 
where R: Read, W: Write 


let mut buf = [0; DEFAULT_BUF_SIZE]; 
let mut written = 0; 
Loop { 
Let Len = match reader.read(&mut buf) { 
Ok(0) => return Ok(written), 
Ok(len) => Len， 
Err(ref e) if e.kind() == ErrorKind::Interrupted => continue, 
Err(e) => return Err(e), 
}; 
writer.write all(&buf[..len])?; 
written += len as uy64; 


} 


这 是 Rust 标准 库 中 std::io::copy() 的 实现 。 因 为 是 泛 型 的 ， 所 以 可 以 使 用 它 将 数据 从 
File 复制 到 TcpStream， 从 Stdin 复制 到 内 存 中 的 vec<u8>， 等 等 。 
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如 果 对 这 里 的 错误 处 理 代 码 不 清楚 ， 可 以 回顾 一 下 第 7 章 。 后 面 会 经 常 使 用 Result， 掌 握 
这 个 类 型 非常 重要 。 
4 个 常用 的 std: :io 的 特 型 Read、BufRead、Write 和 Seek 有 一 个 专门 的 前 置 模块 只 包含 它们 : 





use std::io::prelude::*; 





这 行 代码 在 本 章 中 还 会 出 现 一 两 次 。 我 们 也 会 习惯 性 地 导入 std: :io 模块 自身 : 


use std::io::{self, Read, Write, ErrorKind}; 


关键 字 self 在 这 里 将 io 声明 为 std: :io 模块 的 别名 。 这 样 ，std::io::Result 和 std::io 
: :Error 就 可 以 写成 更 简单 的 io::Result 和 io::Error 了 。 


18.1.1 读 取 器 
std: :to::Read 有 几 个 读 取 数据 的 方法 ， 这 些 方法 都 以 读 取 器 本 身 的 mut 引用 为 参数 。 








reader.read(&mut buffer) 从 数据 源 读 取 某 些 字 节 ， 然 后 存储 到 给 定 的 buffer 中 。 
buffer 参数 的 类 型 是 &mut [u8]。 这 个 方法 会 读 取 buffer.len() 字 贡 。 

返回 类 型 是 io: :ResuLt<u64>， 这 是 ResuLt<u64，io::Error> 类 型 别名 。 操 作成 功 ，u64 
直 是 读 取 的 字 市 数 ， 可 能 等 于 或 小 于 buffer.Len()， 即 使 数据 源 还 有 数据 也 不 会 更 多 ， 
这 要 看 数据 源 。0k(9) 意味 着 没有 输入 要 读 取 了 。 


操作 错误 ，.read() 返回 Err(err)， 其 中 err 是 一 个 io::Error 值 。io::Error 值 是 可 
以 打印 的 ， 其 格式 适合 人 类 阅读 。 对 于 程序 ， 它 有 一 个 .kind() 方法 ， 此 方法 返回 
io::ErrorKind 类 型 的 错误 码 。 这 个 枚 举 的 成 员 中 有 PermissionDenied 和 ConnectionReset 
等 。 多 数 表 示 不 能 忽略 的 严重 错误 ， 需 要 特殊 处 理 。io::ErrorKkind::Interrupted 对 应 
Unix 错误 码 EINTR， 意 思 是 读 取 操 作 被 某 个 信号 中 断 了 。 除 非 程 序 有 处 理 信 号 的 逻辑 ， 否 
则 这 时 候 就 应 该 重 试 。 前 一 节 中 copy() 的 代码 就 给 出 了 这 种 情况 下 重新 读 取 的 例子 。 

如 你 所 见 ，.read() 方法 是 非常 低级 的 ， 甚 至 还 继承 了 底层 操作 系统 的 怪癖 。 如 果 给 ; 
据 源 的 新 类 型 实现 Read 特 型 ， 这 会 有 很 多 余地 。 如 果 是 读 取 某 些 数据 ， 则 会 很 痛苦 。 
因此 ，Rust 提供 了 一 些 高 级 的 便捷 方法 。 这 些 方法 默认 都 实现 了 .read() 的 逻辑 ， 而且 
也 都 会 自动 处 理 Errorkind: :Interrupted， 所 以 你 就 不 用 自己 处 理 了 。 


reader.read_to_end(&mut byte_vec) 从 读 取 器 中 读 出 所 有 剩余 输入 ,追加 到 byte_vec 中 。 
byte_vec 是 一 个 Vec<u8>。 这 个 方法 返回 io::Result<(usize)>， 即 读 到 的 字 节 数 。 

这 个 方法 对 添加 到 向 量 中 的 数据 量 没有 限制 ， 因 此 不 要 对 不 可 信 的 数据 源 使 用 它 。( 可 
以 使 用 .take() 方法 来 添加 限制 ， 如 下 所 述 。) 

reader.read_to_string(&mut string) 类 似 ， 只 是 将 数据 追加 到 给 定 的 String。 如 果 输 
入 流 不 是 有 效 的 UTF-8， 这 个 方法 会 返回 ErrorKind::InvalidData 错误 。 

在 某 些 语 言 中 ， 字 节 输 入 和 字符 输入 由 不 同类 型 处 理 。 目 前 ，UTF-8 的 地 位 如 日 中 天 ， 
Rust 认可 这 个 事实 标准 并 在 所 有 地 方 都 支持 UTF-8。 其 他 字符 集 通过 开源 的 encoding 
包 支 持 。 
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。 reader .read_exact(&mut buf) 读 取 恰好 足够 的 数据 填充 到 给 定 的 buffer 中 。 这 个 参数 
类 型 是 8&[u8] 。 如 果 读 取 器 在 读 到 buf.tLen() 字 节 前 已 经 把 数据 读 完 了 ， 这 个 方法 会 返 
回 ErrorKind: :UnexpectedEof 错误 。 

以 上 都 是 Read 特 型 的 主要 方法 。 此 外 ， 还 有 4 个 适配器 方法 ， 以 reader 的 值 为 参数 ， 将 

其 转换 为 一 个 迭代 器 或 一 个 不 同 的 读 取 器 。 

。 reader.bytes() 返回 输入 流 字 节 的 进 代 器 。 友 代 器 项 的 类 型 是 io: :ResuLt<u8>， 因 此 每 
个 字 节 都 需要 错误 检查 。 另 外 ， 这 个 方法 对 每 个 字 贡 都 会 调用 一 次 reader.read()， 这 
对 没有 缓冲 的 读 取 器 来 说 效率 很 低 。 

。 reader.chars() 类 似 ， 只 不 过 氨 代 器 项 是 字符 ， 将 输入 当 作 UTF-8。 无 效 的 UTF-8 导致 
InvalidData 错误 。 

。 reader.chain(reader2) 返回 新 读 取 器 ， 产 生 reader 的 所 有 输入 和 reader2 的 所 有 输入 。 

。 reader.take(n) 返回 新 读 取 器 ， 从 与 reader 相同 的 数据 源 读 取 输入 ， 但 只 读 取 n 字 市。 


没有 关闭 读 取 器 的 方法 。 读 取 器 和 写 人 器 通常 都 会 实现 Drop， 因 而 会 自动 关闭 。 


18.1.2 缓冲 读 取 器 

为 提高 效率 ， 读 取 器 和 写 入 器 可 以 缓冲 起 来 。 所 谓 缓冲 ， 简 单 来 说 就 是 给 读 取 器 和 写 入 
器 一 块 内 存 (缓冲 区 )， 用 来 暂时 保存 输入 和 输出 数据 。 缓 冲 可 以 减少 系统 调用 ， 如 图 
18-2 所 示 。 在 这 个 例子 中 ， 应 用 通过 调用 .read_line() 方法 从 BufReader 中 读 取 数据 。 而 
BufReader 再 从 操作 系统 上 读 取 更 大 的 数据 块 。 



























































BufReader<File> 
read_Line() .read() 每 
每 次 读 一 行 ， 次 读 8 KB， 














调用 1373 次 调用 7 次 


is not to scale. The actual default size of a “BufReader 's buffer is several 














图 18-2; 缓冲 文件 读 取 器 示例 

这 张 图 是 不 成 比例 的 。BufReader 缓冲 区 的 实际 默认 大 小 有 几 千 字 节 ， 因 此 一 次 系统 read 
可 以 应 付 几 百 次 .read_tline() 调用 。 因 为 系统 调用 相对 较 慢 ， 所 以 这 就 显得 很 重要 的 了 。 
(如 图 所 示 ， 操 作 系统 也 有 一 个 缓冲 区 ， 原 因 相同 : 系统 调用 慢 ， 但 从 磁盘 读 取 数 据 更 慢 。) 
缓冲 读 取 器 实现 了 Read 和 BufRead 两 个 特 型 ， 后 者 增加 了 以 下 方法 。 
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。 reader.read_line(&mut Line) 读 取 一 行文 本 并 追加 到 Line，line 是 一 个 String。 行 尾 

的 换行 符 '\n' 也 会 包含 在 Line 中 。 如 果 输 入 有 Windows 风格 的 行 终结 符 "\r\n"， 则 
这 两 个 字符 也 会 包含 在 Line 中 。 

返回 值 是 io: :Result<usize>， 表 示 读 取 的 字 市 数 ， 包 括 行 终结 符 (如 果 有 的 话 )。 

如 果 读 取 器 处 于 输入 末尾 ， 则 Line 不 变 且 返回 0k(0)。 

。 reader.lines() 返回 输入 行 的 迭代 器 。 迭 代 项 类 型 是 io: :ResuLt<String>。 换 行 符 不 会 
包含 在 字符 串 中 。 如 果 输 入 中 有 Windows 风格 的 行 终结 符 "\r\n"， 则 这 两 个 字符 都 会 
被 去 掉 。 

这 个 方法 基本 上 可 以 满足 读 取 文本 输入 的 需求 。 接 下 来 的 两 布 将 展示 使 用 它 的 几 个 例子 。 

。 reader.read_until(stop_byte, &mut byte vec) 和 reader.split(stop_byte) 与 .read_ 


line() 和 .Lines() 类 似 ， 只 是 以 字 节 为 单位 ， 产 生 Vec<u8> 而 非 String。stop_byte 表 
示 定 界 符 。 


BufRead 还 提供 了 两 个 低级 设计 方法 .fill_buf() 和 .consume(n)， 用 于 直接 访问 读 取 器 
内 部 的 缓冲 区 。 关 于 这 两 个 方法 的 详细 信息 ， 请 参考 在 线 文 档 。 


接 下 来 的 两 节 将 详细 介绍 缓冲 读 取 器 


18.1.3” 读 取 文 本 行 


下 面 这 个 函数 实现 了 Unix 的 grep 命令 ， 它 会 搜索 多 行文 本 ， 通 常 与 其 他 命令 通过 管道 组 
合 使 用 ， 以 查找 指定 写 入 器 : 


use std::io; 
use std::io::prelude::*; 


























荆 
































fn grep(target: &str) -> io::Result<()> { 
let stdin = io::stdin(); 
for line result in stdin.lock().lines() { 
let Line = line result?; 
if line.contains(target) { 
println!("{}", line); 
} 


} 
Ok(()) 


因为 我 们 想 调用 .tines()， 所 以 需要 输入 源 实现 BufRead。 此 时 ， 调 用 io::stdin() 取 
得 输入 的 数据 。 不 过 Rust 标准 库 用 互 斥 量 保护 stdin。 为 此 要 调用 .tock() 给 stdin 加 
锁 以 明确 当前 线程 专 有 使 用 。 这 个 方法 返回 实现 BufRead 的 StdinLock 值 。 在 循环 最 后 ， 
StdinLock 会 被 清除 ， 释 放 互 斥 量 。( 没 有 互 斥 量 ， 两 个 线程 同时 读 取 stdiin 会 导致 未 定义 
行为 。C 语言 也 有 相同 问题 ， 且 以 使 用 方式 来 解决 。 所 有 C 标准 库 输入 和 输出 函数 都 会 在 
百 台 得 到 一 把 锁 。 唯 一 的 区 别 是 在 Rust 中 需要 显 式 获得 锁 。) 


这 个 函数 的 其 他 地 方 都 很 简单 :调用 .lines() 之 后 遍历 得 到 的 迭代 器 。 因 为 这 个 迄 代 器 产 
生 Result 值 ， 所 以 使 用 ? 操作 符 检 查 错误 。 
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假设 我 们 想 进 一 步 扩展 这 个 greg 程序 ， 增 加 搜索 磁盘 上 文件 的 功能 。 可 以 把 它 改 写 为 泛 型 
国 数 ; 
fn grep<R>(target: &str, reader: R) -> io::Result<()> 


where R: BufRead 


for line_ result in reader.lines() { 
let Line = line_ result?; 
if line.contains(target) { 
println!("{}", line); 
} 


} 
Ok(()) 


这 样 就 既 可 以 给 它 传 StdinLock 也 可 以 传 缓冲 File 了 : 


Let stdin = io::stdin(); 
grep(&target，stdin.Lock())?; // 没 问 题 


let f = File::open(file)?; 

grep(&target，BufReader::new(f))?; // 同样 没 问 题 
注意 ，File 不 会 自动 缓冲 ， 因 为 它 实现 的 是 Read 而 非 BufRead。 不 过 ， 为 File 或 其 他 非 
缓冲 读 取 器 创建 缓冲 读 取 器 很 容易 。BufReader: :new(reader) 就 可 以 实现 。( 设 置 缓冲 区 的 
大 小 ， 可 以 使 用 BufReader::with_capacity(size, reader),) 
在 大 多 数 语言 中 ， 文 件 默 认 会 被 缓冲 。 如 果 想 要 非 缓 冲 的 输入 或 输出 ， 则 必须 知道 如 何 关 
闭 缓冲 。 而 在 Rust 中 ，File 和 BufReader 是 两 个 不 同 的 库 特 性 ， 因 为 有 时 候 需 要 不 带 缓冲 
的 文件 ， 有 时 候 需 要 非 文 件 的 缓冲 〈 例 如 ， 缓 冲 网 络 输入 ) 。 
下 面 是 一 个 包含 错误 处 理 和 基本 参数 解析 的 完整 程序 。 

// grep: 搜索 stdin 或 某 些 文件 中 匹配 指定 字符 串 的 行 
































use std::error::Error; 

use std::io::{self, BufReader}; 
use std::io::prelude::*; 

use std::fs::File; 

use std::path::PathBuf; 


fn grep<R>(target: &str, reader: R) -> io::Result<()> 
where R: BufRead 


{ 
for line result in reader.lines() { 
let Line = line result?; 
if line.contains(target) { 
println!("{}", line); 
} 
Ok(()) 
} 


fn grep_main() -> Result<(), Box<Error>> { 
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// 取得 命令 行 参数 。 第 一 个 参数 是 要 搜索 的 字符 串 ， 其 余 参 数 是 文件 名 
let mut args = std::env::args().skip(1); 
let target = match args.next() { 
Some(s) => s, 
None => Err("usage: grep PATTERN FILE...")? 
}; 
Let files: Vec<PathBuf> = args.map(PathBuf::from).collect(); 


if files.is empty() { 
Let stdin = io::stdin(); 
grep(&target, stdin.lock())?; 
} elsef 
for file in files { 
let f = File::open(file)?; 
grep(&target, BufReader: :new(f))?; 


} 
} 
Ok(()) 
} 
fn main() { 
let result = grep_main(); 
if Let Err(err) = result { 
let _ = writeln!(io::stderr(), "{}", err); 
} 
} 


18.1.4 ”收集 行 


有 些 读 取 器 方法 (包括 .lines()) 会 返回 产生 Result 值 的 迭代 器 。 第 一 次 把 文本 中 的 所 有 
行 收集 到 一 个 大 向 量 中 时 ， 你 会 磁 到 去 除 Result 的 问题 。 


不 错 ， 但 要 是 能 在 这 里 使 用 .cotlect() 就 好 了 。 实 际 上 确实 也 可 以 。 为 此 只 需 弄 请 


// 没 问 题 ， 但 不 是 你 想 要 的 


Let results: Vec<io::Result<String>> = reader.lines().collect(); 


// 错误 : 不 能 将 Result 集 合 转 换 为 Vec<String> 

let lines: Vec<String> = reader.lines().collect(); 
第 二 次 编译 不 通过 。 怎 么 处 理 这 个 错误 ? 最 直观 的 方式 是 编写 for 循环 ， 检 查 每 一 项 是 否 
包含 错误 : 

Let mut Lines = vec![]; 

for line_result in reader.lines() { 


} 


lines.push(line_result?); 


得 哪 种 类 型 : 
let Lines = reader.lines().collect::<io::Result<Vec<String>>>()?; 


为 什么 这 样 能 行 ? 标准 库 中 为 Result 实现 了 FromIterator (查看 在 线 文档 很 容易 略 过 )， 








本 本 
A 


要 取 





就 是 这 个 实现 让 使 用 .collect() 成 为 可 能 : 


impl<T, E, C> FromIterator<Result<T, E>> for Result<C, E> 
where C: FromIterator<T> 


€ 
} 


这 个 实现 意味 着 ， 如 果 可 以 将 类 型 T 的 项 收集 到 类 型 C (where C: FromIterator<T>) 的 
集合 中 ， 那 么 就 可 以 将 类 型 Result<T，E> 的 项 收集 为 类 型 Result<C，E> (FromIterator 
<Result<T, E>> for ResuLt<C，E>) 。 


换 句 话说 ，io: :Result<Vec<String>> 是 一 个 集合 类 型 ， 因 此 .collect() 方法 可 以 创建 并 填 
充 该 类 型 的 值 。 


18.1.5 写 入 器 
如 前 所 见 ， 操 作 输 入 主要 是 使 用 方法 完成 的 。 输 出 则 有 点 不 同 。 
本 书 中 会 一 直 使 用 printtn!() 产生 纯 文本 输出 。 


println!("Hello, world!"); 




















println!("The greatest common divisor of {:?} is {}", 
numbers, d); 


还 有 一 个 不 会 在 行 尾 添加 换行 符 的 print!() 宏 。print!() 和 println!1() 的 格式 化 代码 与 
format! 宏一 样 ，17.4 节 曾 详细 介绍 过 。 

要 问 一 个 写 入 器 发 送 输出 ， 可 以 使 用 write!() 和 writetn!() 安 。 它 们 跟 print!() 和 
println!() 类 似 ， 只 是 有 两 点 不 同 。 


writeln!(io::stderr(), "error: worLd not helloable")?; 


writeln!(&mut byte_ vec, "The greatest common divisor of {:?} is {}", 
numbers, d)?; 


一 个 不 同 是 这 两 个 write 宏 都 多 了 一 个 参数 ， 即 第 一 个 参数 ， 这 是 一 个 写 入 器 。 男 一 个 不 
同 是 它们 都 返回 Result， 因 此 必须 处 理 错误 。 这 也 是 每 行 末尾 都 使 用 ? 操作 符 的 原因 。 
print 宏 不 返回 Resutt， 它 们 只 会 在 写 和 人 失败 时 许 异 。 因 为 写 入 的 是 终端 ， 所 以 很 少 失 败 。 
Write 特 型 有 如 下 方法 。 
。 writer.write(&buf) 将 切片 buf 中 的 某 些 字 节 写 入 底层 流 。 这 个 方法 返回 io: :Result<usize>， 
成 功 则 包含 写 入 的 字 节 数 ， 可 能 小 于 buf.len()， 这 取决 于 流 。 
与 Reader: :read() 类 似 ， 这 是 一 个 低级 方法 ， 应 该 尽量 不 要 直接 使 用 。 
。 writer.write_all(&buf) 将 切片 buf 中 的 所 有 字 节 都 写 入 ， 返 回 ResuLt<()>。 
。 writer.fLush() 将 所 有 缓冲 数据 都 写 到 底层 流 ， 返 回 Result<()>。 


与 读 取 器 类 似 ， 写 入 器 也 会 在 被 清除 时 自动 关闭 。 
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就 像 BufReader: :new(reader) 会 给 任何 读 取 器 添加 缓冲 一 样 ，BufWriter::new(writer) 也 
会 给 任何 写 入 器 添加 缓冲 。 


Let file = File::create("tmp.txt")?; 
Let writer = BufWriter::new(file); 


要 设置 缓冲 区 的 大 小 ， 可 以 使 用 BufWriter::with_capacity(size, writer)。 


在 Bufwriter 被 清除 时 ， 所 有 剩余 缓冲 数据 都 会 写 入 底层 写 和 器。 不 过 ， 如 果 在 写 入 期 间 
发 生 错误 ， 错 误 则 会 被 忽略 。( 因 为 错误 会 在 BufWriter 的 .drop() 方法 中 发 生 ， 所 以 没 办 
法 报告 。) 为 确保 应 用 可 以 发 现 所 有 输出 错误 ， 应 该 在 清除 之 前 ， 和 手工 使 用 .flush() 清理 
缓冲 写 和 器。 


18.1.6 文件 

本 书 已 经 介绍 了 两 种 打开 文件 的 方式 。 

。 File::open(filename) 打开 已 有 文件 供 读 取 。 这 个 方法 返回 一 个 io::Result<File>， 如 
果 文 件 不 存在 就 是 一 个 错误 。 

。 File::create(filename) 创建 新 文件 供 写 入 。 如 果 指 定名 字 的 文件 已 存在 ， 则 该 文件 会 
被 删节 。 

注意 File 类 型 在 文件 系统 模块 std: :fs 中 ， 不 在 std::io 中 。 

如 果 这 两 种 方式 都 不 能 满足 要 求 ， 则 可 以 使 用 0pen0ptions 指定 想 要 的 行为 : 


use std::fs::0penOptions; 





















































Let Log = OpenOptions: :new() 
.append(true) // 如 果 文 件 存 在 ， 则 在 末尾 追加 内 容 


.open("server .Log" )?; 








Let file = OpenOptions: :new() 
.write(true) 


.Create_new(true) // 如 果 文 件 存在 则 失败 

.Open("new_file.txt")?; 
方法 .append()、.write()、.create_new() 等 都 可 以 连 级 调用 ， 因 为 它们 都 返回 self。 
这 种 方法 连 级 调用 的 模式 在 Rust 中 很 常见 ， 它 们 有 一 个 名 字 叫 构建 器 (builder)。 
std: :process::Command 也 是 一 个 例子 。 要 了 解 关 于 0pen0ptions 的 更 多 信息 ， 请 参考 在 线 
文档 。 
File 打开 后 ， 就 跟 任 何其 他 读 取 器 或 写 入 器 一 样 。 可 以 根据 需要 添加 缓冲 。File 也 会 在 被 
清除 时 自动 关闭 。 


18.1.7 搜寻 


File 也 实现 了 Seek 特 型 ， 这 意味 着 可 以 在 File 里 跳 转 ， 而 不 是 只 能 从 头 到 尾 一 次 性 读 取 
或 写 入 。Seek 的 定义 如 下 : 























pub trait Seek { 
fn seek(&mut self, pos: SeekFrom) -> io::Result<y64>; 


} 

pub enum SeekFrom { 
Start(u64) ， 
End(1L64) ， 
Current(i164) 


3 


由 于 这 个 枚 举 ，seek 方法 表达 力 非 常 强 。fiLe.seek(SeekFrom: :Start(0)) 表示 跳 到 开始 位 
置 ，file.seek(SeekFrom::Current(-8)) 表示 后 退 8 字 节 。 


搜寻 文件 很 慢 。 无 论 是 机 械 硬盘 还 是 SSD (Solid-State Drive， 固 态 硬 盘 )， 一 次 搜寻 都 相 
当 于 读 取 几 兆 数 据 。 


18.1.8 其 他 读 取 器 和 写 入 器 类 型 


本 章 前 面 展 示 了 一 些 实现 Read 和 Write 的 非 Fite 类 型 的 例子 。 下 面 再 详细 介绍 一 下 这 些 

类 型 。 

。 io::stdin() 返回 标准 输入 流 的 读 取 器 ， 类 型 为 io: :Stdin。 因 为 它 由 所 有 线程 共享 ， 所 
以 每 次 读 取 都 涉及 获得 和 释放 互 斥 量 。 
Stdin 有 一 个 .lock() 方法 用 于 获得 互 斥 量 并 返回 一 个 io::StdinLock， 这 是 一 个 缓冲 
读 取 器 ， 在 被 清除 之 前 会 持 有 互 扩 量 。 因 此 StdinLock 上 的 个 别 操作 可 以 避免 互 斥 量 开 
销 。18.1.3 市 展示 过 使 用 这 个 方法 的 示例 代码 。 

出 于 技术 原因 ，io: :stdin().lock() 行 不 通 。 这 个 锁 保存 对 Stdin 值 的 引用 ， 而 这 意 
着 Stdin 值 必须 保存 在 某 个 生命 期 足够 长 的 地 方 : 


let stdin 
let Lines 






























































io::stdin(); 

stdin.Lock().Lines(); // 没 问 题 

。 io::stdout() 和 io::stderr() 返回 标准 输出 和 标准 错误 流 的 写 和 器。 它们 都 有 互 不 量 
和 .Lock() 方法 。 

。 Vec<u8> 实现 了 Write。 写 入 Vec<u8> 可 以 用 新 数据 扩展 向 量 。 
(不 过 ，String 没有 实现 write。 要 使 用 write 构建 字符 串 ， 首 先 要 写 到 一 个 Vec<u8> 
中 ， 然 后 再 使 用 String: :from_utf8(vec) 把 向 量 转换 为 字符 串 。) 

。 cursor::new(buf) 创建 了 一 个 新 cursor， 是 一 个 从 buf 中 读 取 数据 的 缓冲 读 取 器 。 用 于 
创建 读 取 String 的 读 取 器 。 参 数 buf 可 以 是 实现 AsRef<[u8]> 的 任何 类 型 ， 因 此 也 可 以 
传 入 &[u8]、&str 或 Vec<u8>。 

Cursor 内 部 很 简单 ， 只 有 两 个 字段 : buf 本 身 和 一 个 整数 ， 此 整数 表示 在 buf 中 的 偏 移 
量 ， 也 就 是 下 次 读 取 的 起 点 。 初 始 位 置 是 0。 

Cursor 实现 了 Read、BufRead 和 Seek。 如 果 buf 的 类 型 是 &mut [u8] 或 vec<u8>， 则 
Cursor 也 实现 了 Write。 写 入 游标 会 从 当前 位 置 开 始 覆 盖 buf 中 相应 的 字 节 。 如 果 写 
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入 字 节 超出 &mut [u8]， 则 只 能 写 入 部 分 内 容 或 者 导致 io::Error。 不 过 ， 使 用 游标 
写 入 超出 Vec<u8> 的 字 节 没有 问题 ， 向 量 会 自动 增长 。 为 此 ，Cursor<&mut [u8]> 和 
Cursor<Vec<u8>> 实现 了 std::io::prelude 的 所 有 4 个 特 型 。 


。 std: :net: :TcpStream 表示 TCP 网 络 连 接 。 因 为 TCP 启用 了 双向 通信 ， 所 以 它 既 是 读 取 
器 又 是 写 入 器 
静态 方法 TcpStream: :connect(("hostname" ， PORT) ) 尝试 连接 服务 器 ， 返 回 io: :ResulLt 
<TcpStream>。 


。 std: :process: :Command 支持 创建 一 个 子 进程 ， 将 数据 导入 其 标准 输入 ， 类 似 下 面 这 样 : 


use std::process::{Command, Stdio}; 














Let mut child = 
Command: :new( "grep") 
.arg("-e") 
.arg("a.*e.*i.*o.*U") 
.Stdin(Stdio: :piped()) 
.Spawn()?; 


Let mut to_child = child.stdin.take().unwrap(); 
for word in my_words { 
writeln!(to_child, "{}", word)?; 

} 

drop(to_child); // 关闭 grep 的 stdin， 因 此 会 退 H 

child.wait()?; 
child.stdin 的 类 型 是 0ption<std::process::Childstdin>。 这 里 在 设置 子 进程 时 使 用 
了 .stdin(Stdio::piped())， 因 此 在 .spawn() 成 功 后 child.stdiin 会 被 填充 数据 。 如 果 没 
有 数据 ， 则 chiLd.stdin 就 是 None。 


Command 也 有 类 似 的 方法 .stdout() 和 .stderr()， 可 以 用 来 在 child.stdout 和 child. 
stderr 中 请 求 读 取 器 。 


std: :to 模块 也 提供 了 一 些 函数 ， 返 回 简单 的 读 取 器 和 写 入 器 


。 io::sink() 是 一 个 无 操作 写 入 器 。 所 有 写 和 方法 都 返回 Ok， 但 数据 会 被 丢弃 。 
。 ee ye 读 取 始终 成 功 ， 但 返回 输入 终止 。 
。 : :repeat(byte) 返回 的 读 取 器 会 反复 给 出 指定 字 节 。 


18.1.9 二进制 数据 、 压 缩 与 序列 化 
很 多 开源 包 在 std: :io 基础 上 提供 了 更 多 功能 。 


比如 ，byteorder 包 提 供 了 ReadBytesExt 和 WriteBytesExt 特 型 ， 为 所 有 二 进 制 输入 和 输出 
的 读 取 器 和 写 入 器 提供 了 方法 : 


use byteorder::{ReadBytesExt, WriteBytesExt, LittleEndian}; 








上 上 


















































let n = reader.read_u32: :<LittLeEndian>()?; 
writer.write i64::<LittleEndian>(n as 164)?; 




















flate2 包 为 读 、 写 gzip 压缩 的 数据 提供 了 额外 的 适配器 方法 : 


use flate2::FlateReadExt; 


let file = File::open("access.log.gz")?; 
let mut gzip_ reader = file.gz_decode()?; 


serde 包 面向 序列 化 和 反 序 列 化 ， 可 以 实现 Rust 数据 结构 与 字 节 之 间 的 互相 转换 。 
节 曾 提 到 过 这 个 包 ， 接 下 来 再 详细 了 解 一 下 。 
假设 我 们 有 一 些 文本 冒险 游戏 的 映射 数据 保存 在 一 个 Hashwap 中 


type RoomId = String; // 每 个 房间 有 一 个 唯一 的 名 字 
type RoomExits = Vec<(char, RoomId)>; // 还 有 一 组 出 口 
type RoomMap = HashMap<RoomId，RoomExits>; // 房间 名 到 出 口 的 映射 ， 简 单 


// 创建 一 个 简单 的 映射 
Let mut map = RoomMap: :new(); 
map.insert("Cobble Crawl".to_string(), 
vec![('W', "Debris Room".to_string())]); 
map.insert("Debris Room".to_string(), 
vec![('E', "Cobble Crawl".to_string()), 
('W', "Sloping Canyon".to_string())]); 























把 这 样 的 数据 转换 为 JSON 输出 只 需要 几 行 代码 : 


use std::io; 
use serde::Serialize; 
use serde_json::Serializer; 


let mut serializer = Serializer::new(io::stdout()); 
map.serialize(&mut serializer)?; 


1 


以 上 代码 使 用 了 serde::Serialize 特 型 的 serialize 方法 。 这 个 库 为 所 有 知道 如 何 序列 





化 的 类 型 添加 了 这 个 特 型 ， 也 包括 我 们 数据 中 用 到 的 类 型 . 字符 串 、 字 符 、 元 组 、 
和 HashMap。 








向 量 


serde 非常 灵 话 。 在 这 个 程序 中 ， 输 出 是 JSON 数据 ， 因 为 我 们 选择 的 是 serde_json 序列 
化 器 。 而 MessagePack 等 其 他 格式 也 是 支持 的 。 类 似 地 ， 可 以 把 上 面 的 输出 发 送 给 一 个 文 
件 、 一 个 Vec<u8> 或 其 他 任何 写 和 器。 上 面 的 代码 会 将 数据 打印 到 stdout ， 示 例如 下 : 
































{"Debris Room":[["E","Cobble Crawl"],["W","Sloping Canyon"]],"Cobble Crawl": 
[["W","Debris Room"]]} 


serde 也 包含 对 派生 两 个 关键 serde 特 型 的 支持 : 


#[derive(Serialize, Deserialize)] 
struct Player { 

location: String, 

items: Vec<String>, 

health: u32 
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到 Rust 1.17 为 止 ， 这 个 #[derive] 属性 要 求 在 项 目 中 多 增加 几 步 设置 工作 。 这 里 就 不 再 
介绍 了 ， 详 细 内 容 可 以 参考 serde 的 文档 。 简 单 来 说 ， 构 建 系统 会 自动 为 Player 实现 
serde::Serialize 和 serde::Deserialize， 因 此 序列 化 Player 的 值 就 简单 了 : 


player.serialize(&mut serializer)?; 
输出 类 似 下 面 这 样 : 


{"location":"Cobble Crawl","items":["a wand"],"health":3} 


18.2 文件 与 目录 


接 下 来 的 几 节 将 介绍 Rust 操作 文件 和 目标 的 特性 ， 它 们 都 包含 在 std: :path 和 std: :fs 模 
块 中 。 所 有 这 些 特性 都 涉及 文件 名 ， 因 此 下 面 先 从 文件 名 相关 的 类 型 开始 。 



































18.2.1 0sStr 和 Path 


遗憾 的 是 ， 操 作 系 统 不 会 强制 文件 名 必须 是 有 效 的 Unicode。 以 下 是 两 个 创建 文本 文件 的 
Linux 终端 命令 。 只 有 第 一 个 使 用 了 有 效 的 UTF-8 文件 名 。 


$ echo "hello world" > 6.txt 
$ echo "0 brave new world, that has such filenames in't" > $'\xf4'.txt 


两 个 命令 必然 都 会 执行 ， 因 为 Linux 内 核 并 不 知道 Ogg Vorbis 的 UTF-8。 对 内 核 而 言 ， 任 
何 字 节 字符 串 (不 包括 空 字 节 和 和 斜 杠 ) 都 是 可 以 接受 的 文件 名 。 在 Window 上 也 是 一 样 ， 
任何 16 位 “ 宽 字符 ”都 是 可 以 接受 的 文件 名 ， 即 使 字符 串 不 是 有 效 的 UTF-16。 操 作 系 统 
处 理 的 其 他 字符 串 也 同样 如 此 ， 比 如 命令 行 参数 和 环境 变量 。 


Rust 字符 串 始 终 是 有 效 的 Unicode。 实 践 中 的 文件 名 也 几乎 是 Unicode。 但 Rust 必须 处 理 
那些 罕见 的 可 能 不 是 Unicode 的 情形 。 这 就 是 Rust 中 有 std: :ffi::0sstr 和 0sstring 的 
原因 。 


0sstr 是 一 种 字符 串 类 型 ， 但 它 是 UTF-8 的 超 集 。 它 的 任务 是 在 当前 系统 上 表示 所 有 文件 
名 、 命 令 行 参数 和 环境 变量 ， 无 论 它们 是 不 是 有 效 的 Unicode。 在 Unix 上 ，0sStr 可 以 保 
存 任何 字 节 序列 。 在 Windows 上 ，0sStr 以 UTF-8 扩展 的 形式 存储 ， 可 以 编码 任何 16 位 
直 的 序列 ， 包 括 不 匹配 的 代理 对 。 


因此 我 们 就 有 了 两 个 字符 串 类 型 : str 对 应 实际 的 Unicode 字符 串 ，0sStr 对 应 操作 系统 可 
能 吐出 来 的 任何 东西 。 此 外 ，std: :path: :Path 也 是 用 于 处 理 文件 名 的 ， 但 它 纯粹 是 出 于 方 
便 性 的 考虑 。Path 与 0sStr 其 实 是 一 样 的 ， 只 是 增加 了 很 多 与 文件 名 相关 的 便捷 方法 。 接 
下 来 的 几 布 会 介绍 这 些 方法 。Path 既 可 用 于 绝对 路 径 也 可 用 于 相对 路 径 。 而 对 于 路 径 中 的 
个 别 组 件 ， 要 使 用 0sstr。 

最 后 ， 每 种 字符 串 类 型 都 有 一 个 对 应 的 拥有 类 型 。 比 如 ，String 拥有 分 配 在 堆 上 的 str， 
std::ffi::0sString 拥有 分 配 在 堆 上 的 0sStr， 而 std::path::PathBuf 拥有 分 配 在 堆 上 的 
Path， 如 表 18-1 所 示 。 



















































































表 18-1: str、0sStr 与 Path 























str Osstr Path 

非 固定 大 小 类 型 ， 始 终 传 引用 是 是 是 

可 以 包含 任意 Unicode 文本 是 是 是 
通常 看 起 来 像 UTF-8 是 是 是 

可 以 包含 非 Unicode 数据 否 是 是 

文本 处 理 方法 是 否 否 

文件 名 相关 的 方法 否 否 是 

拥有 型 、 可 增强 的 堆 空间 对 应 类 型 String 0sString PathBuf 

转换 为 拥有 类 型 .to_string() .to_os_string() .to_path_buf() 


这 3 个 类 型 全 都 实现 了 常用 特 型 AsRef<Path>， 因 此 可 以 轻松 声明 一 个 接收 “任何 文件 名 
类 型 ”作为 参数 的 泛 型 函数 。 这 里 用 到 了 13.7 节 介 绍 过 的 相关 技术 : 


use std::path::Path; 
use std::io; 


fn swizzle file<P>(path_arg: P) -> io::Result<()> 
where P: AsRef<Path> 


{ 
Let path = path_arg.as_ref(); 


} 
所 有 以 path 为 参数 的 标准 函数 和 方法 都 使 用 了 这 个 技术 ， 因 此 可 以 给 它们 直接 传 字符 
看 量 。 
18.2.2 Path 和 PathBuf 的 方法 
除了 其 他 未 列 出 的 方法 外 ，Path 提供 了 以 下 方法 。 


。 Path::new(str) 将 &str 和 &0sStr 转换 为 &Path。 这 样 不 会 复制 字符 串 ， 新 的 &Path 只 
是 指向 原始 &str 和 8&0sstr 的 相同 字 节 。 


use std::path::Path; 
Let home dir = Path::new("/home/fwolfe"); 


(类 似 地 ，0sStr::new(str) 将 &str 转换 为 &0sStr。) 
。 path.parent() 返回 路 径 的 父 目录 (如 果 有 的 话 ) ， 返 回 类 型 是 0ption<&Path>。 
这 样 不 会 复制 路 径 ，path 的 父 目 录 始 终 是 path 的 一 个 子 字 符 串 。 


assert_eq!(Path: :new("/home/fwolfe/program.txt").parent(), 
Some(Path: :new("/home/fwolfe"))); 


。 path.file_name() 返回 path 最 后 的 组 件 (如 果 有 的 话 )， 返 回 类 型 是 Option<&0sStr>。 
通常 情况 下 ，path 包含 目录 、 斜 枉 和 文件 名 ， 因 此 这 个 方法 返回 文件 名 。 


assert_eq!(Path: :new("/home/fwoLfe/program.txt" ) .fiLLe_name( ) ， 
Some(OsStr::new("program.txt"))); 





由 







































































输入 和 输出 | 365 


path.is_absolute() 和 path.is_reLative() 用 于 检测 文件 是 绝对 路 径 还 是 相对 路 径 ， 比 
如 Unix 路 径 /usr/bin/advent 或 Windows 路 径 Ci\Program Files 是 绝对 路 径 ， 而 src/main. 
rs 是 相对 路 径 。 
path1.join(path2) 连接 两 个 路 径 ， 返 回 新 的 PathBuf 。 

Let path1 = Path::new("/usr/share/dict"); 


assert_eq!(path1.join("words"), 
Path: :new("/usr/share/dict/words")); 


如 果 path2 是 绝对 路 径 ， 则 只 会 返回 path2 的 副本 ， 因 此 这 个 方法 可 以 用 于 将 任何 路 径 
转换 为 绝对 路 径 : 

Let abs_path = std::env::current_ dir()?.join(any_path); 
path.components() 返回 给 定 路 径 各 组 件 的 迭代 器 ， 从 左 到 在。 迭代 项 类 型 是 std: :path 
::Component， 这 是 一 个 枚 举 ， 表 示 文 件 名 中 可 能 出 现 的 所 有 可 能 的 组 件 ; 


pub enum Component< 'a> { 
Prefix(PrefixComponent<'a>)， // 仅 限 Witndows: 盘 符 或 共享 盘 





























RootDir ， // 根 目 录 ，/ 或 \ 
CurDir ， // 特殊 目录 . 
ParentDir ， // 特殊 目录 .. 
Normal(&'a OsStr) // 纯 文件 或 目录 名 











} 


例如 ，Windows 路 径 \venice\Music\A Love Supreme\04-Psalm.mp3 由 表示 \\venice 的 
prefix、 表 示 \Music 的 RootDir 和 表示 A Love Supreme 及 04-Psalm.mp3 的 两 个 Normal 
组 件 组 成 。 


详细 信息 请 参考 在 线 文 档 。 


这 些 方法 操作 的 是 内 存 中 的 字符 串 。Path 也 有 一 些 查 询 文 件 系 统 的 方法 : .exists()、.is_ 


file()、.is_dir()、.read_dir()、.canonicalize()， 等 等 。 更 多 信息 请 参考 在 线 文 档 。 





将 Path 转换 为 字符 串 有 3 个 方法 。 每 个 方法 都 允许 Path 中 存在 无 效 的 UTF-8。 


path.to_str() 将 Path 转换 为 字符 串 ， 返 回 类 型 为 Option<&str>。 如 果 Path 不 是 有 效 
的 UTF-8， 则 返回 None。 


if let Some(file str) = path.to str() { 
println!("{}", file_str); 

下 否则 跳 过 这 个 名 字 古 怪 的 文件 
path.to_string_lossy() 基本 上 是 一 样 的 ， 但 它 总 是 设法 在 任何 情况 下 都 返回 某 种 字 
符 串 。 如 果 path 不 是 有 效 的 UTF-8， 则 创建 一 个 副本 ， 将 每 个 无 效 的 字 节 序列 替换 为 
Unicode 替换 字符 U+FFFD ( 命 )。 
这 个 方法 的 返回 类 型 是 std: :borrow: :Cow<str>， 一 个 或 借用 或 拥有 的 字符 串 。 要 从 这 个 什 
取得 一 个 String， 使 用 它 的 .to_owned() 方法 。( 关 于 Cow 的 更 多 信息 ， 参 见 13.11 市 。) 


path.display() 用 于 打印 路 径 : 


println!("Download found. You put it in: {}", dir_path.display()); 
































这 个 方法 返回 的 值 不 是 字符 串 ， 但 实现 了 std::fmt::Display， 因 此 可 以 在 format!()、 
println!1() 及 类 似 方法 中 使 用 。 如 果 路 径 不 是 有 效 的 UTF-8， 则 输出 中 可 能 包含 象 字符。 


18.2.3 文件 系统 访问 函数 





表 18-2 展示 了 std: :fs 中 


的 一 些 国 数 及 其 在 Unix 和 Windows 中 对 应 的 命令 或 方法 。 所 有 


这 些 国 数 都 返回 to: :ResutLt 值 ， 除 非特 别 说 明 ， 都 是 ResuLt<()>。 
表 18-2: 文件 系统 访问 函数 一 览 








Rust 函 数 Unix Windows 
创建 和 删除 ”create_dir(path) mkdir() CreateDirectory() 
create_ dir all(path) 类 似 mkdir -p 类 似 mkdir 
remove_dir(path) rmdir() RemoveDirectory() 
remove_dir_all(path) 类 似 rm -r 类 似 rmdir /s 
remove_file(path) unlink() Deleterile() 
复制 、 移 动 copy(src_path, dest_path) -> 类 似 cp -p CopyFileEx() 
与 链接 Result<u64> 
rename(src_path, dest_path) rename() MoveFileEx() 
hard_link(src_path, dest_path) Link() CreateHardLink() 
检查 canonicalize(path) -> Result<PathBuf> realpath() GetFinaLPathNameByHandtLe() 
metadata(path) -> Result<Metadata> stat() GetFileInformationByHandle() 
symlink_metadata(path) -> lstat() GetFileInformationByHandle() 
Result<Metadata> 
read_dir(path) -> Result<ReadDir> opendir() FindFirstFile() 
read_link(path) -> Result<PathBuf> readlink() FSCTL_GET_REPARSE_POINT 
权限 set_permissions(path, perm) chmod() SetFileAttributes() 
(copy() 返回 的 数值 表示 所 复制 文件 的 大 小 ， 单 位 是 字 市 。 关 于 创建 符号 链接 ， 参 见 18.2.5 





市 。) 


Do。 


可 见 ，Rust 在 努力 提供 跨 
统 中 都 是 可 预测 的 。 











平台 的 函数 ， 让 它们 在 Windows、macOS、Linux 及 其 他 Unix 系 


全 面 介绍 文件 系统 的 特性 超出 了 本 书 范围 ， 如 果 你 想 进 一 步 了 解 这 些 函 数 ， 可 以 在 网 上 查 
到 更 多 相关 资料 。 下 一 市 也 会 给 出 儿 个 例子 。 








所 有 这 些 函 数 都 是 通过 调 
会 通过 字符 串 处 理 去 掉 给 








用 操作 系统 实现 的 。 例 如 ，std: :fs::canontcattze(path) 不 仅仅 
定 path 中 的 . 和 ..， 它 还 要 基于 当前 目录 解析 相对 路 径 ， 跟 踪 符 


号 链接 。 如 果 path 不 存在 则 会 报错 。 


std: :fs::metadata(path) 


和 std::fs::symLink_metadata(path) 产生 的 Metadata 类 型 包含 


有 关 文 件 类 型 、 大 小 、 权 限 和 时 间 惟 的 信息 。 同 样 ， 详 情 请 参考 在 线 文档 。 


为 方便 考虑 ，Path 类 型 也 内 置 了 这 样 几 个 方法 。 比 如 path.metadata() 其 实 就 相当 于 
std: :fs: :metadata(path), 
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18.2.4 读 取 目录 
要 列 出 目录 下 的 内 容 ， 可 以 使 用 std: :fs::read_dir 或 Path 的 .read_dir() 方法 : 


for entry_result in path.read dir()? { 
let entry = entry_result?; 
println!("{}", entry.file name().to_string_lossy()); 





注意 ， 代 码 中 有 两 行 用 到 了 ? 操作 符 。 第 一 行 要 检测 打开 目录 可 能 遇 到 的 错误 。 第 二 行 要 
检测 读 取 下 一 个 条 目 可 能 遇 到 的 错误 。 


这 里 entry 的 类 型 是 std: :fs::DirEntry， 是 一 个 有 几 个 方法 的 结构 体 。 


。 entry.file_name() 是 文件 或 目录 的 名 称 ， 类 型 为 0sString。 

。 entry.path() 类 似 ， 但 包含 原始 路 径 ， 产 生 一 个 新 PathBuf。 如 果 要 读 取 的 目录 是 
“/home/jimb”, 而 entry.file name() 返回 “.emacs”, 那么 entry.path() 会 返回 PathBuf: :from 
(“/home/jimb/.emacs” )。 

。 entry.file_type() 返回 一 个 io::Result<FileType>。FileType 有 .is_file()、.is_dir() 
和 .is_symlink() 方法 。 

。 entry.metadata() 获取 当前 条 目的 其 他 元 数据 。 

在 读 取 目录 时 ， 不 会 列 出 特殊 目录 .和 ..。 

下 面 是 一 个 比较 贴近 实际 的 例子 。 以 下 代码 会 在 磁盘 上 将 一 个 目录 树 递 归 复 制 到 另 一 个 目 

录 下 : 

use std::fs; 


use std::io; 
use std::path::Path; 
































/// 将 已 有 目录 src 复 制 到 目标 路 径 dst 
fn copy_dir_to(src: &Path，dst: &Path) -> io::Result<()> { 
if !dst.is_dir() { 
fs::create dir(dst)?; 





} 


for entry_result ;in src.read dir()? { 

let entry = entry_result?; 

Let file type = entry.file type()?; 

copy_to(&entry.path(), &file type, &dst.join(entry.file_ name()))?; 
} 


Ok(()) 





下 面 这 个 函数 copy_to， 可 以 复制 个 别 目录 的 条 目 : 


/// 将 src 中 的 所 有 内 容 复制 到 目标 路 径 dst 
fn copy_to(src: &Path，src_type: &fs::FileType, dst: &Path) -> io::Result<()> { 
if src type.is file() { 
fs::copy(src, dst)?; 
} else if src type.is dir() { 











copy_dir to(src, dst)?; 
} else{ 
return Err(io::Error::new(io::ErrorKind::0Other, 
format!("don't know how to copy: {}", 
src.display()))); 


} 
Ok(()) 


18.2.5 平台 特定 的 特性 
前 面 的 copy_to 函数 可 以 复制 文件 和 目录 ， 而 我 们 还 想 在 Unix 上 支持 符号 链接 。 


没有 跨 平台 的 方法 可 以 同时 支持 在 Unix 和 Windows 上 创建 符号 链接 ， 但 标准 库 提供 了 特 
定 于 Unix 的 symlink 函数 。 


use std::0s::unix::fs::symlink; 


使 用 这 个 函数 ， 可 以 简化 实现 。 为 此 只 需要 给 copy_to 函数 的 if 表达 式 添加 一 个 分 支 : 




















} else if src type.is symlink() { 
Let target = src.read_ link()?; 
symlink(target, dst)?; 


只 要 面向 Unix 系统 (如 Linux 和 macOS) 编译 这 个 程序 ， 就 没有 问题 


std: :os 模块 包含 类 似 symtLink 的 各 种 平台 特定 的 特性 。std: :os 在 标准 库 中 实际 上 类 似 下 
面 这 样 《有 些 像 诗 ， 但 格律 不 对 ) : 


// ! 05S 特 定 功能 

#[cfg(unix)] pub mod unix; 
#[cfg(windows)] pub mod windows; 
#[cfg(target os = "ios")] pub mod ios; 
#[cfg(target os = "Linux")] pub mod Linux; 
#[cfg(target os = "macos")] pub mod macos; 

















\#[cfg] 属性 表示 条 件 编译 ， 其 中 每 个 模块 都 只 在 特定 平台 上 才 会 存在 。 这 也 是 修 
改 后 的 程序 使 用 std::os::unix 只 能 面向 Unix 成 功 编译 的 原因 ， 因 为 在 其 他 平台 上 
std::0s::unix 是 不 存在 的 。 

如 果 想 让 代码 在 所 有 平台 上 都 编译 ， 而 且 要 支持 Unix 平台 上 的 符号 链接 ， 则 必须 也 在 程 
序 中 使 用 \#[cfg]。 此 时 ， 只 需要 在 Unix 上 导入 symlink， 而 在 其 他 系统 中 定义 自己 的 
symLink 替代 函数 : 


#[cfg(unix)] 
use std::0s::unix::fs::symlink; 




































































/// 在 不 支持 的 平台 上 定义 替代 的 symLink 实 现 
#[cfg(not(unix))] 
fn symLink<P: AsRef<Path>，Q: AsRef<Path>>(src: P, _dst: Q) 





输入 和 输出 | 369 


-> std::io::Result<()> 


{ 
Err(io::Error::new(io::ErrorKind::0Other, 
format!("can't copy symbolic link: {}", 
src.as_ref().dispLay()))) 
} 


在 本 书写 作 时 ， 位 于 Rust 官方 网 站 上 的 在 线 文档 是 通过 (在 Linux 上 ) 对 标准 库 运 行 
rustdoc 生成 的 。 这 意味 着 其 中 不 包含 针对 macOS、Windows 和 其 他 平台 特性 的 内 容 。 查 
看 这 些 平台 特定 内 容 的 最 好 方式 是 在 你 自己 的 平台 上 运行 rustup doc， 然 后 查看 生成 的 
HTML 文档 。 当 然 ， 也 可 以 直接 查看 源 代码 。 

实际 上 symLink 是 一 种 特殊 情况 。 大 多 数 特定 于 Unix 的 特性 并 非 单 独 的 函数 ， 而 是 给 标准 
库 类 型 添加 新 方法 的 扩展 特 型 (11.2.2 节 介 绍 过 扩展 特 型 )。 有 一 个 prelude 模块 ， 可 以 用 
于 一 次 性 启用 所 有 这 些 扩展 : 

use std::0s::unix::prelude::*; 


例如 ， 在 Unix 上 ， 这 样 会 给 std::fs::Permissions 添加 一 个 .mode() 方法 ， 可 以 访问 表示 
Unix 中 权限 的 一 个 底层 u32 值 。 类 似 地 ， 这 样 也 会 扩展 std: :fs::Metadata， 增 加 对 底层 
struct stat 值 的 访问 器 字段 ， 比 如 .uid() 会 返回 文件 所 有 者 的 用 户 ID。 

总 的 来 说 ，std::os 的 内 容 相 当 基 础 。 更 多 平台 特定 的 功能 都 是 通过 第 三 方 包 来 支持 的 ， 
比如 可 以 访问 Windows 注册 表 的 winreg。 


18.3 网络 编程 

关于 网 络 编程 的 内 容 超出 了 本 书 的 范围 。 不 过 ， 假 如 你 已 经 了 解 了 一 些 网 络 编程 的 内 容 ， 
那么 本 节 可 以 帮 你 尽快 上 手 Rust 网 络 编程 。 
要 编写 低级 的 网 络 代 码 ， 可 以 使 用 std: :net 模块 ， 这 个 模块 提供 了 对 TCP 和 UPD 网 络 通 
信 的 跨 平 台 支 持 。 要 支持 SSL/TLS， 可 以 使 用 native_tls 包 。 


这 些 模块 为 基于 网 络 创建 直观 、 阻 塞 式 输入 和 输出 提供 了 方便 。 可 以 只 用 几 行 代码 就 实现 
一 个 简单 的 服务 器 ， 用 std: :net 为 每 个 连接 创建 一 个 线程 。 例 如 ， 下 面 就 是 一 个 示例 的 
“回声 ”(echo) 服务 器 : 

use std::net::TcpListener; 


use std::io; 
use std::thread::spawn; 












































// 永远 接受 连接 ， 每 个 连接 创建 一 个 线程 
fn echo main(addr: &str) -> io::Result<()> { 
let listener = TcpListener::bind(addr)?; 
println!("listening on {}", addr); 
Loop { 
// 等 待 客户 端 连接 
let (mut stream，addr) = listener.accept()?; 
println!("connection received from {}", addr); 











// 创建 一 个 线程 服务 于 客户 端 
let mut write_stream = stream.try_clone()?; 
spawn(move || { 
// 将 从 stream 中 接收 的 东西 再 发 送 回 去 
io::copy(&mut stream，&mut write_stream) 
.expect("error in client thread: "); 
println!("connection closed'"); 





























]); 
} 
} 
fn main() { 
echo_main("127.0.0.1:17007").expect("error: "); 
} 














这 个 “回声 ”服务 器 只 是 简单 地 重 发 你 发 给 它 的 东西 。 上 面 的 代码 跟 使 用 Java 或 Python 
写 的 没有 多 少 不 同 。( 下 一 章 会 介绍 std: :thread: :spawn()。) 

不 过 ， 对 于 高 性 能 服务 器 ， 需 要 异步 输入 和 输出 。mio 包 对 此 提供 了 必需 的 支持 。MIO 工 
作 在 非常 低 的 级 别 ， 提 供 简单 的 事件 循环 和 异步 读 取 、 写 入 、 连 接 和 接收 连接 的 方法 ， 基 
本 上 重 现 了 整个 网 络 API。 每 个 异步 操作 完成 后 ，MIO 都 会 向 你 写 的 事件 处 理 程序 中 发 送 
一 个 事件 。 

还 有 一 个 实验 性 的 tokio 包 ， 用 基于 期 许 (future) 的 API 封 装 了 mio 事件 循环 ， 期 许 类 似 
于 JavaScript 中 的 期 约 (promise ) 。 

高 级 协议 是 通过 第 三 方 包 支持 的 。 例 如 ，reqwest 包 为 HTTP 客户 端 提 供 了 漂亮 的 API。 
下 面 是 一 个 完整 的 命令 行程 序 ， 可 以 通过 以 http 或 https 开头 的 URL 获取 任何 文档 ， 然 后 
在 终端 打印 出 来 。 这 些 代码 使 用 了 reqwest = "0.5.1"。 


extern crate reqwest; 




















use std::error::Error; 
use std::io::{self, Write}; 


fn http_get main(url: &str) -> Result<(), Box<Error>> { 
// 发 送 HTTP 请 求 ， 获 得 响应 
let mut response = reqwest::get(uyrl)?; 
if !response.status().is success() { 
Err(format!("{}", response.statuyus()))?; 


} 


// 读 取 响应 体 ， 并 将 其 写 入 stdout 
let stdout = io::stdout(); 
io::copy(&mut response，&mut stdout.lock())?; 





Ok(()) 
} 


fn main() { 
let args: Vec<String> = std::env::args().collect(); 
if args.len() !=2.{ 
writeln!(io::stderr(), "usage: http-get URL").unwrap(); 
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return; 


} 


if let Err(err) = http_get main(&args[1]) { 
writeln!(io::stderr(), "error: {}", err).unwrap(); 


} 
} 


型 等 齐 


为 HTTP 服务 器 而 写 的 iron 框架 则 提供 了 BeforeMiddleware 和 AfterMiddLeware 特 型 等 高 
级 协议 。 这 两 个 特 型 支持 实现 可 挺拔 式 应 用 。 而 websocket 包 实 现 了 WebSocket 协议 。 还 























有 很 多 这 样 的 第 三 方 包 ， 本 章 就 不 再 列举 了 。Rust 还 是 一 门 年 轻 的 语言 ， 开 源 社区 生机 趣 





勃 。 支 持 网 络 编程 的 第 三 方 包 日 





新 月 异 、 层 出 不 穷 。 








第 19 章 


并 发 





长 远 来 看 ， 不 建议 用 面向 机 器 的 语言 编写 允许 无 限 使 用 存储 位 置 及 其 地 址 的 大 型 并 
发 程序 ， 因 为 我 们 没有 办 法 保证 这 种 程序 的 可 靠 性 (即使 有 复杂 硬件 机 制 的 帮助 )。 


Per Brinch Hansen (1977 年 ) 





通信 模式 就 是 并 行 模式 。 
一 一 Whit Morriss 

如 果 你 对 并 发 的 态度 在 你 的 职业 生涯 期 间 发 生 了 变化 ， 那 你 并 不 是 唯一 一 个 有 这 种 思想 转 
变 的 人 。 这 是 一 种 常见 现象 。 
首先 ， 并 发 代码 好 写 、 好 玩 。 线 程 、 锁 、 队 列 等 工具 随 取 随 用 。 没 错 ， 陷 阱 也 很 多 ， 但 好 
在 我 们 知道 所 有 这 些 陷 阱 ， 只 要 小 心 一 点 就 不 会 出 错 。 
有 些 时 候 ， 你 不 得 不 调试 别人 写 的 多 线程 代码 ， 最 终 被 迫 得 出 结论 : 某 些 人 真 的 不 应 该 使 
用 这 些 工 具 。 
而 有 些 时 候 ， 你 又 不 得 不 调试 自己 的 多 线程 代码 。 
经 验 让 你 养 成 了 对 所 有 多 线程 代码 合理 质疑 的 习惯 ， 甚 至 会 感到 彻底 灰心 。 特 别 是 突然 看 
到 一 篇 深入 剖析 为 什么 看 起 来 一 点 问题 没有 的 多 线程 惯用 代码 却 不 能 工作 的 文章 ， 更 进 一 
步 强 化 了 你 的 感受 。( 这 与 “内 存 模 型 ”有 关 。) 不 过 ， 最 终 你 又 发 现 了 一 种 可 以 在 项 目 里 
使 用 而 不 会 经 常 出 错 的 并 发 代码 的 写法 。 你 可 以 在 这 种 写法 里 塞 进 很 多 东西 ， 同 时 (如 果 
你 真 的 明白 了 ) 也 学 会 了 对 过 多 的 复杂 性 说 “不 ”。 
当然 ， 惯 用 写法 有 很 多 。 系 统 程序 员 常 用 的 方法 如 下 。 
。 一 个 后 台 线 程 (background thread) 只 负责 一 件 事 ， 而 且 周 期 性 “ 醒 来 ”去 做 这 件 事 。 
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。 通用 线程 池 (worker pool) 通过 任务 队列 与 客户 端 通信 。 
。 管道 (pipeline) 将 数据 从 一 个 线程 导入 另 一 个 线程 ， 每 个 线程 只 做 一 小 部 分 工作 。 
。 数据 并 行 (data parallelism) 假设 (不管 正确 与 否 ) 整个 计算 机 主要 用 于 一 项 大 型 计算 ， 














这 个 大 型 计算 进而 又 拆 分 成 个 小 任务 ， 在 n 个 线程 上 执行 ， 希望 所 有 个 机 器 的 核心 
同时 工作 。 

同步 对 象 海 (sea of synchronized object) 中 多 个 线程 拥有 同一 数据 权限 ， 使 用 基于 互 斥 
量 等 低级 原 语 的 临时 锁 方案 避免 争 用 。(Java 内 置 支持 这 种 模型 ， 此 模型 在 20 世纪 90 
年 代 到 21 世纪 初 一 度 非常 流行 。) 





。 原子 整数 操作 (atomic integer operation) 允许 多 核心 通过 以 一 个 机 器 字 大 小 的 字段 传递 


信息 而 实现 通信 。( 除 非 要 交换 的 数据 就 是 整数 值 ， 否 则 这 种 方法 比 其 他 手段 更 难以 保 
证 正确 。 实 践 中 ， 这 通常 意味 着 传递 指针 。) 





随 着 时 间 推移 ， 你 可 能 会 用 到 其 中 一 些 方法 并 将 它们 安全 地 组 合 起 来 使 用 。 此 时 你 已 经 算 
是 艺术 大 师 了 。 只 要 没有 其 他 人 “染指 ”系统 ， 一 切 就 堪 称 完美 。 使 用 线程 的 程序 尽 是 无 
法 言说 的 “ 潜 规则 "。 

Rust 为 使 用 并 发 提供 了 更 好 的 手段 ， 但 不 是 强迫 所 有 程序 采用 一 种 风格 (这 对 于 系统 程序 
员 来 说 相当 于 没有 解决 方案 ) ， 而 是 安全 地 支持 多 种 风格 。 无 法 言说 的 规则 在 代码 中 被 写 
了 下 来 ， 由 编译 器 负责 监督 。 

我 们 一 直 在 说 通过 Rust 可 以 编写 安全 、 快 速 的 并 发 程序 。 因 此 本 章 将 专门 讲述 如 何 开发 并 
发 程序 ， 主 要 介绍 了 使 用 Rust 线程 的 3 种 方式 。 

。 并 行 分 又 -合并 














通道 
共享 可 修改 状态 


在 此 期 间 ， 我 们 会 用 到 迄今 为 止 学 习 到 的 关于 Rust 语言 的 一 切 。Rust 对 引用 、 可 修改 能 


2 





生命 期 的 重视 在 单线 程 程序 里 已 经 体现 出 了 价值 ， 但 这 些 规则 只 有 在 并 发 编程 时 才 真 











正体 现 得 淋漓 尽 致 。 以 这 些 为 基础 ， 可 以 扩展 工具 箱 ， 可 以 快速 而 正确 地 灶 合 各 种 风格 的 
多 线程 代码 ， 没 有 质疑 ， 设 有 灰心 ， 没 有 臣 惧 。 


19.1 并 行 分 又 -合并 


线程 的 最 简单 用 例 是 同时 执行 儿 个 完全 无 关 的 任务 。 
假设 要 对 大 量 语 料 文档 进行 自然 语言 处 理 。 可 以 写 一 个 循环 : 











fn process_files(filenames: Vec<String>) -> io::Result<()> { 
for document in filenames { 
Let text = Load(&document)?; // 读 取 源 文件 
Let results = process(text); // 计算 统计 值 
save(&document，,，results)?;  // 写 入 输出 文件 


} 
Ok(()) 





这 个 程序 的 执行 过 程 如 图 19-1 所 示 。 











process_files 





图 19-1: process_files() 的 单线 程 执行 过 程 


因为 每 个 文档 都 是 单独 处 理 的 ， 所 以 要 想 加 快 处 理 速度 很 容易 。 只 要 把 语 料 分 块 ， 然 后 分 
别 在 独立 的 线程 上 处 理 每 一 块 即 可 ， 如 图 19-2 所 示 。 











process_files_in_parallel 











19-2: 使 用 分 叉 - 合并 手段 多 线程 处 理 文件 


这 个 模式 就 叫 作 并 行 分 叉 - 合并 。 分 叉 fork) 就 是 启动 一 个 新 线程 ， 而 合并 (join) 就 是 
等 待 线程 完成 。 第 2 章 已 经 运用 过 这 种 技术 通过 多 线程 来 加 速 绘制 曼 德 布 洛 特集 合 。 
并 行 分 又 一 合并 有 如 下 优点 。 


。 非常 简单 。 分 又 一 合并 很 容易 实现 ， 在 Rust 中 也 很 容易 正确 处 理 。 

。 避免 沽 有 烦 。 分 又 -合并 过 程 中 不 涉及 给 共享 资源 加 锁 。 只 有 在 任务 结束 后 ， 一 个 线程 才 
需要 等 待 另 一 个 线程 。 在 执行 任务 期 间 ， 每 个 线程 都 可 以 自由 运行 。 这 样 可 以 保证 降低 
任务 切换 的 开销 。 

。 性 能 计算 直观 。 在 最 好 的 情况 下 ， 局 动 4 个 线程 可 以 只 用 四 分 之 一 时 间 完 成 任务 。 图 
19-2 展示 了 不 能 对 提速 抱 有 理想 预期 的 一 个 原因 , 即 可 能 无 法 为 每 个 线程 平均 分 派 任 务 。 
另 一 个 要 注意 的 原因 是 ， 有 时 候 分 又 - 合并 程序 在 线程 合并 后 必须 花 一 些 时 间 来 组 合 所 
有 线程 计算 的 结果 。 换 句 话说， 完全 隔离 任务 可 能 造成 额外 的 工作 量 。 不 过 ， 除 了 这 两 
点 ， 任 何 CPU 密集 型 程序 在 隔离 工作 单元 下 都 会 有 显著 的 性 能 提升 。 
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。 容易 推断 程序 是 否 正 确 。 只 要 线程 之 间 是 真正 隔离 的 ， 分 又 一 合并 程序 就 是 确定 性 的 ， 
就 像 绘 制 曼 德 布 洛 特集 合 的 程序 一 样 。 无 论 线程 计算 速度 如 何 ， 程 序 最 终 都 会 得 到 相同 
结果 。 这 是 一 种 无 资源 争 用 的 并 发 模型 。 


分 又 -合并 的 主要 缺点 是 要 求 工作 单元 隔离 。 本 章 后 面 会 分 析 一 些 没 办 法 分 得 这 么 清楚 的 
问题 。 


下 面 还 是 以 自然 语言 处 理 为 例 ， 展 示 几 种 适用 于 process_files 函数 的 分 又 -合并 模式 。 


19.1.1 产生 及 合并 
要 产生 一 个 新 线程 ， 可 以 使 用 std: :thread: :spawn 国 数 。 


spawn(|| { 
println!("hello from a child thread"); 
}) 


它 接收 一 个 参数 、 一 个 Fnonce 财 包 或 国 数 。Rust 会 启动 一 个 新 线程 来 运行 该 闭 包 或 函数 
的 代码 。 这 个 新 线程 是 一 个 真实 的 操作 系统 线程 ， 有 自己 的 栈 ， 与 C++、C# 和 Java 中 的 
线程 一 样 。 


下 面 是 一 个 更 实际 的 例子 ， 甚 使 用 spawn 实现 了 前 面 process_files 函数 的 并 行 版 : 


use std::thread::spawn; 
























































fn process_files in parallel(filenames: Vec<String>) -> io::Result<()> { 
// 将 工作 分 成 儿 块 
const NTHREADS: usize = 8; 
Let worklists = split vec into_chunks(filenames, NTHREADS); 


// 分 又 : 每 个 块 产生 一 个 线程 来 处 理 
Let mut thread_handles = vec![]; 
for worklist in worklists { 
thread_handles .push( 
spawn(move || process_files(worklist)) 





} 


// 合并 : 等 待 所 有 线程 完成 

for handle in thread handles { 
handle.join().unwrap()?; 

} 


Ok(()) 
} 


下 面 逐 行 分 析 一 下 这 个 函数 。 
fn process_files in parallel(filenames: Vec<String>) -> io::Result<()> { 
个 并 行 版 本 的 函数 与 原始 的 process_files 有 相同 的 类 型 签名 ， 因 此 可 以 方便 替换 。 
// 将 工作 分 成 几 块 


const NTHREADS: usize = 8; 
Let worklists = split vec into chunks(filenames, NTHREADS); 





这 里 使 用 了 一 个 辅助 函数 split_vec_into_chunks (没有 展示 ) 来 拆 分 工作 。 结 果 保 存在 了 
worklists 中 ， 这 是 一 个 向 量 的 癌 量 ， 其 中 包含 将 原始 向 量 filenames 平均 分 成 的 8 份 大 小 
相等 的 切片 。 
// 分 又 : 每 个 块 产生 一 个 线程 来 处 理 
Let mut thread_handles = vecl![]; 
for worklist in worklists { 
thread_handles.push( 
spawn(move || process_files(worklist)) 
); 
} 
为 每 个 worklist 产生 一 个 线程 。spawn() 返回 一 个 名 为 JoinHandle 的 值 ， 后 面 会 用 到 。 这 
里 先 把 所 有 JoinHandle 保存 到 一 个 向 量 中 。 


注意 把 文件 名 列表 转换 为 工作 线程 的 过 程 : 


。 在 父 线程 中 ， 通 过 for 循环 定义 并 转移 workList; 
创建 move 闭 包 时 ，worklist 被 转移 到 闭 包 中 ; 
。 然后 spawn 将 闭 包 (以 及 worklist 向 量 ) 转移 到 新 的 子 线程 中 。 


这 些 转移 开销 很 小 。 与 第 4 章 讨论 的 Vec<sString> 的 转移 一 样 ，String 不 会 被 克隆 。 事 实 
上 ， 整 个 过 程 不 涉及 内 存 分 配 和 释放 。 唯 一 转移 的 数据 是 Vec 本 身 ， 只 有 3 个 机 器 字 。 
我 们 创建 的 每 个 线程 都 需要 代码 和 数据 来 启动 。Rust 团 包 可 以 方便 地 用 来 包含 我 们 想 要 的 
数据 和 代码 。 
继续 来 看 代码 : 

// 合并 : 等 待 所 有 线程 完成 

for handle in thread_handles { 

handle. join().unwrap()?; 






































} 

这 里 使 用 前 面 收集 的 JoinHandle 的 .join() 方法 来 等 待 全 部 8 个 线程 完成 。 合 并 线程 对 保 
证 正确 性 是 必需 的 ， 因 为 Rust 程序 会 在 main 返回 后 立即 退出 ， 即 使 其 他 线程 仍 在 运行 。 
析 构 器 不 会 被 调用 ， 其 他 线程 会 直接 被 杀 死 。 如 果 这 不 是 你 想 要 的 结果 ， 那 就 必须 在 mnain 
返回 之 前 合并 这 些 线程 。 

如 有 果 这 个 循环 结束 ， 就 意味 着 全 部 8 个 子 线程 都 已 经 成 功 完 成 了 。 因 此 函数 就 返回 0k(()) 
表示 终止 : 

Ok(()) 









































19.1.2 ” 跨 线 程 错 误 处 理 
因为 错误 处 理 ， 所 以 前 面 用 来 合并 子 线程 的 代码 比 看 起 来 要 麻烦 。 再 看 一 看 那 行 代码: 


handle. join().unwrap()?; 


这 个 .join() 方法 为 我 们 做 了 两 件 漂亮 事 。 
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首先 ，handle.join() 返回 一 个 std::thread::ResuLt， 如 果子 线程 证 异 则 是 一 个 错误 。 相 
比 之 下 ， 这 就 让 Rust 中 的 线程 代码 比 C++ 中 可 靠 多 了 。 在 C++ 中 ， 越 界 访问 数组 是 未 定 
义 行 为 ， 没 有 任何 保证 系统 其 他 部 分 不 受 该 行为 影响 的 措施 。 而 在 Rust 中 ， 许 异 是 安全 且 
局 限于 每 个 线程 的 。 线 程 之 间 的 边界 构成 诈 异 的 防火 墙 ， 即 许 异 不 会 自动 从 一 个 线程 传播 
到 依赖 它 的 其 他 线程 。 相 反 ， 一 个 线程 的 许 异 在 其 他 线程 中 会 体现 为 包含 错误 的 Result。 
程序 整体 上 很 容易 恢复 。 

不 过 在 我 们 的 程序 中 ， 并 没有 任何 多 余 的 放 异 处 理 代 码 。 我 们 只 是 在 ResuLt 上 立即 调用 
了 .unwrap()， 断 言 它 是 一 个 Ok 结果 ， 而 不 是 Err 结果 。 假 如 某 个 子 线程 确定 诈 异 了 ， 那 么 
这 个 断言 会 失败 ， 因 而 父 线程 也 会 诈 异 。 这 里 相当 于 显 式 将 诈 异 从 子 线程 传播 到 父 线 程 。 
其 次 ，handle.join() 把 子 线程 返回 的 值 传 给 了 父 线程 。 我 们 传 给 spawn 的 闭 包 的 返回 类 型 
是 io::ResuLt<()>， 也 就 是 process_files 返回 值 的 类 型 。 这 个 返回 值 不 会 被 丢弃 。 在 子 
线程 完成 时 ， 其 返回 值 会 被 保存 ， 而 JoinHandle: :join() 会 将 该 值 传送 到 父 线程 。 

在 这 个 程序 中 ，handle.join() 返回 的 完整 类 型 是 std: :thread: :ResuLt<std: :io: :ResuLt<()>>， 
其 中 的 thread: :Result 部 分 是 spawn/joinAPI 相关 类 型 ，io: :ResutLt 是 我 们 应 用 的 相关 类 
型 。 

对 我 们 的 代码 来 说 ， 这 里 在 展开 thread: :Result 之 后 ， 对 io: :Result 使 用 了 ? 操作 符 ， 显 
式 将 IO 错误 从 子 线程 传播 到 父 线 程 。 
这 些 看 起 来 好 像 还 挺 复杂 的 。 但 毕竟 只 是 一 行 代 码 ， 因 此 可 以 跟 其 他 语言 比较 一 下 。Java 
和 C# 的 默认 行为 是 将 子 线程 的 异常 抛 到 终端 ， 然 后 就 不 管 了 。 在 C++ 中， 默认 行为 是 中 
断 进 程 。 而 在 Rust 中 ， 错 误 是 一 种 Resut 值 (数据 )， 而 不 是 异常 (控制 流 )。 可 以 像 其 他 
任何 值 一 样 跨 线程 传送 它们 。 不 论 何 时 ， 只 要 编写 使 用 低级 线程 API 的 代码 ， 就 必须 仔细 
编写 错误 处 理 代 码 。 既 然 必须 要 编写 错误 处 理 代 码 ， 那 么 使 用 Result 没 错 。 


19.1.3” 跨 线程 共享 不 可 修改 数据 


假设 我 们 要 做 的 分 析 需 要 一 个 大 型 英语 单词 和 短语 的 数据 库 : 


// 之 前 
fn process_files(filenames: Vec<String>) 

























































































// 之 后 


fn process_files(filenames: Vec<String>, glossary: &GigabyteMap) 


这 里 的 glossary 将 会 很 大 ， 因 此 我 们 传 它 的 引用 。 如 何 更 新 process_files_in_parallel 
把 这 个 词汇 表 传 给 工作 线程 呢 ? 


这 样 明显 的 修改 是 不 行 的 : 


fn process_files_in_ parallel(filenames: Vec<String>, 
glossary: &GigabyteMap) 





-> io::Result<()> 


{ 


for worklist in worklists { 





thread_handLes.push( 
spawn(move || process_fiLes(workList，gLossary)) // 错误 


了 


} 
我 们 简单 地 给 函数 添加 了 一 个 glossary 参数 ， 直 接 把 它 传 给 process_files。Rust 会 抱怨 : 


error[E0477]: the type ‘[closure@...]. does not fulfill the required lifetime 
--> concurrency_spawn_lifetimes.rs:35:13 


35 spawn(move || process_files(worklist, glossary)) // 错误 


| 

| 

| 人 人 八 八 八 八 
= note: type must satisfy the static lifetime 

Rust 抱怨 的 是 传 给 spawn 的 闭 包 的 生命 期 。 

spawn 会 启动 一 个 独立 的 线程 。Rust 无 法 知道 一 个 子 线程 会 运行 多 长 时 间 ， 因 此 它 假设 一 
种 最 坏 的 情况 ， 即 子 线程 可 能 会 在 父 线 程 已 经 完成 且 父 线程 中 所 有 的 值 都 消失 之 后 继续 
运行 。 显然 ， 如 果子 线程 会 持续 如 此 长 的 时 间 ， 那 么 它 运行 的 闭 包 也 需要 持续 这 么 长 的 时 
间 。 但 这 个 闭 包 的 生命 期 是 界定 的 ， 它 依赖 glossary 引用 ， 而 引用 不 会 永远 存在 。 
注意 ，Rust 拒绝 编译 这 个 代码 是 对 的 ! 按照 编写 这 个 函数 的 方式 ， 如 果 一 个 线程 触发 了 
IO 错误 ， 就 可 能 导致 process_files_in_parallel 在 其 他 线程 完成 前 退出 。 那 么 其 他 子 线 
程 就 有 可 能 在 主线 程 被 释放 之 后 还 继续 使 用 gLossary。 这 就 造成 了 和 争 用 ， 假 如 判 主线 程 赢 
的 话 ， 那 奖品 就 是 未 定义 行为 。Rust 不 会 允许 这 种 情况 发 生 。 

看 起 来 spawn 在 支持 跨 线程 引用 方面 是 很 开放 的 。 确 实 ，14.1.2 节 介绍 过 类 似 情形 。 当 时 
的 解决 方案 是 使 用 nove 闲 包 把 数据 的 所 有 权 转 移 到 新 线程 。 但 这 里 不 行 ， 因 为 有 多 个 线 
程 需要 使 用 同一 份 数据 。 为 每 个 线程 克隆 一 份 词汇 表 是 一 种 安全 的 方案 ， 但 因为 词汇 表 太 
大 ， 我 们 不 能 这 么 做 。 好 在 标准 库 提供 了 另 一 种 方式 : 原子 引用 计数 。 

4.4 市 介绍 过 Arc， 现 在 该 把 它 派 上 用 场 了 : 


use std::sync::Arc; 






































fn process_files_ in parallel(filenames: Vec<String>, 
glossary: Arc<GigabyteMap>) 
-> io: :Result<()> 


for worklist in worklists { 
// 这 里 调用 .clone() 只 是 克隆 Arc 并 触发 引用 计数 。 并 不 会 克隆 GigabyteMap 
let glossary_for_child = glossary.clone(); 
thread_handles .push( 
spawn(move || process_files(worklist, &glossary_for_child)) 








); 
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为 此 我 们 修改 了 gtossary 的 类 型 : 为 并 行 运行 分 析 ， 调 用 者 必须 传 入 一 个 Arc<GigabyteMap>。 
这 是 一 个 指向 通过 Arc: :new(giga_map) 移动 到 堆 上 的 GigabyteMap 的 智能 指 

调用 glossary.clone() 后 ， 会 创建 Arc 智能 指针 而 不 是 整个 GlgabyteMap 的 一 个 副本 。 这 
相当 于 增加 一 次 引用 计数 。 

这 样 修改 之 后 ， 程 序 就 可 以 编译 通过 并 运行 了 ， 因 为 它 不 再 依赖 引用 的 生命 期 。 只 要 有 任 
何 线程 拥有 Arc<GigabyteMap>， 了 映射 就 不 会 释放 ， 即 使 父 线程 早 就 退出 了 。 因 为 Arc 中 的 
数据 是 不 可 修改 的 ， 所 以 也 不 会 出 现任 何 数据 争 用 。 











19.1.4 Rayon 

标准 库 的 spawn 函数 是 一 个 重要 的 原 语 ， 但 并 不 是 专门 为 并 行 分 又 -合并 设计 的 。 已 经 
有 更 好 的 分 又 -合并 API 构建 在 其 基础 之 上 。 例 如 ， 第 2 章 使 用 的 Crossbeam 库 在 8 个 
线程 间 分 配 任务 。Crossbeam 的 受 限 线程 (scoped thread) 可 以 相当 自然 地 支持 并 行 分 又 
一 合并 。 

Niko Matsakis 写 的 Rayon 库 是 另 一 个 例子 。 这 个 库 提 供 了 两 种 运行 并 发 任务 的 方式 : 


extern crate rayon; 
use rayon::prelude::*; 


//“ 并 行 做 两 件 事 ” 

Let (vi, v2) = rayon::join(fn1, fn2); 

//“ 并 行 做 N 件 事 ” 
giant_vector.par_iter().for_each(|value| { 


do_thing_with_value(value); 


1 


rayon::join(fn1，fn2) 就 是 调用 两 个 函数 并 返回 两 个 结果 。 而 .par_iter() 方法 会 创建 一 
个 ParallelIterator， 这 个 值 有 map、filter 和 其 他 方法 ， 非 常 类 似 于 Rust 的 Iterator。 
在 上 面 的 两 种 情况 下 ，Rayon 会 使 用 自己 的 工作 线程 池 在 必要 时 拆 分 工作 。 只 要 告诉 
Rayon 什么 任务 可 以 并 行 去 做 ，Rayon 就 会 尽 可 能 以 最 佳 的 方式 管理 线程 和 任务 分 配 。 


图 19-3 展示 了 两 种 理解 giant_vector.par_iter().for_each(...) 调用 的 方式 。(a) 表面 上 
看 ，Rayon 会 为 向 量 中 的 每 个 元 素 都 启动 一 个 线程 。(b) 在 后 台 ，Rayon 会 让 每 个 工作 线程 
对 应 一 个 CPU 核心 ， 这 样 效率 更 高 。 这 个 工作 线程 池 由 程序 的 所 有 线程 共享 。 在 同时 有 
数 千 个 任务 时 ，Rayon 会 自动 拆 分 工作 。 






















































































19-3: Rayon 的 理论 和 实践 


这 是 使 用 Rayon 重 写 的 process_files_in_parallel 的 版 本 : 


extern crate rayon; 
Use rayon::prelude::*; 


fn process files in parallel(filenames: Vec<String>, glossary: &GigabyteMap) 
-> io: :Result<()> 


{ 
filenames.par_iter() 
.map(|filename| process file(filename, glossary)) 
.reduce with(|r1i, r2| { 
if ri.is err() { ri } else { r2} 

}) 
.unwrap_or(Ok(())) 

} 














相 比 于 std: :thread: :spawn 的 版 本 ， 以 上 代码 更 少 ， 也 更 好 理解 。 下 面 逐 行 分 析 一 下 。 








首先 ， 使 用 filenames.par_iter() 创建 并 行 迭 代 器 。 

使 用 .map() 对 每 个 文件 名 (filename) 调用 process_file。 这 样 会 得 到 io: :Result<()> 
值 的 一 个 ParallelIterator。 

然后 用 .reduce_with() 组 合 结果 。 在 这 里 ， 我 们 保留 第 一 个 错误 (如果 有 的 话 )， 然 后 
丢弃 其 他 错误 。 如 果 想 累积 所 有 错误 或 者 打印 它们 ， 可 以 在 这 里 操作 。 


也 可 以 给 .reduce_with() 方法 传 入 一 个 成 功 后 返回 有 用 值 的 .map() 闭 包 。 或 者 
给 .reduce_with() 传人 一 个 知道 如 何 组 合 两 个 成 功 结果 的 闭 包 。 

.reduce_with() 返回 一 个 0ption， 只 有 filename 为 空 时 才 是 None。 最 后 使 用 0ption 
的 .unwrap_or() 方法 让 结果 0k(())。 














并 发 | 381 


在 后 台 ，Rayon 使 用 一 种 名 为 工作 窃取 (work-stealing) 的 技术 动态 地 在 线程 间 平 衡 负载 。 
通常 ， 这 样 会 比 19.1.1 节 展 示 的 手工 提前 分 派 工作 效率 更 高 ， 更 能 保持 CPU 满载 。 

不 仅 如 此 ，Rayon 还 支持 在 线程 间 共 享 引 用 。 任 何 后 台 发 生 的 并 行 处 理 都 可 以 保证 在 
reduce_with 返回 时 完成 。 这 也 是 可 以 把 glossary 传 给 process_file， 而 不 用 考虑 该 闭 包 
会 被 多 个 线程 调用 的 原因 。 
(顺便 说 一 下 ， 这 里 使 用 map 和 reduce 方法 并 不 是 巧合 。 由 Google 和 Apache Hadoop 带 火 
的 MapReduce 编程 模型 与 分 又 - 合并 有 很 多 共通 之 处 。 可 以 将 其 看 作 一 种 查询 分 布 式 数据 
的 分 又- 合并 方法 。) 


19.1.5 重 温 曼 德 布 洛 特集 合 

第 2 章 使 用 分 又- 合并 方式 并 发 演 染 了 曼 德 布 洛 特集 合 。 结 果 浑 染 速度 快 了 4 倍 ， 非 常 
令 人 震撼 。 不 过 还 没有 达到 它 应 有 的 震撼 程度 。 假 如 在 一 个 8 核 的 机 器 上 启动 8 个 工作 
线程 呢 ? 
问题 在 于 我 们 做 不 到 工作 负载 的 平均 分 配 。 计 算 图 像 中 的 一 个 像素 相当 于 运行 一 个 循环 
(参见 2.6.1 节 )。 而 图 像 浅 灰色 区 域 由 于 循环 会 快速 退出 而 比 黑色 部 分 泻 染 得 更 快 。 医 
此 ， 虽 然 把 图 像 分 成 了 相同 大 小 的 水 平 长 条 ， 但 实际 上 每 一 条 的 工作 负载 是 不 均等 的 ， 如 
图 19-4 所 示 。 
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图 19-4: 曼 德 布 洛 特 程序 中 不 均等 的 工作 分 布 

使 用 Rayon 很 容易 解决 这 个 问题 。 可 以 将 输出 中 的 每 一 行 像素 作为 一 个 并 行 任务 ， 于 是 就 
可 以 创建 数 百 个 任务 。Rayon 可 以 将 这 些 任务 分 派 给 自己 的 线程 。 由 于 工作 窃取 技术 ， 每 
个 任务 工作 量 的 大 小 都 不 重要 了 。Rayon 会 在 计算 期 间 动态 平衡 。 

下 面 是 实现 代码 。 第 一 行 和 最 后 一 行 是 2.6.6 节 展 示 过 的 main 国 数 的 一 部 分 ， 中 间 部 分 是 
修改 后 的 演 染 代码 。 









































Let mut pixels = vec![0; bounds.0 * bounds.1]; 
// 将 pixels 切 分 为 水 平 长 条 的 作用 域 
{ 


Let bands: Vec<(usize, &mut [u8])> = pixels 
.Chunks_mut(bounds.0) 
.enumerate() 
.COLLect(); 


bands.into_par_iter() 
.weight_max() 
.for_each(|(i, band)| { 
let top = i; 
Let band_bounds = (bounds.0, 1); 
Let band_upper_Left = pixel_ to point(bounds, (0, top), 
upper_left, lower_right); 
Let band_Lower_right = pixel_ to point(bounds, (bounds.0, top + 1)， 
upper_left, lower_right); 
render(band, band_bounds, band_upper_left, band_lower_right); 
}); 
} 


write_bitmap(&args[1], &pixels, bounds).expect("error writing PNG file"); 


首先 ， 创 建 要 传 给 Rayon 的 任务 集合 bands。 每 个 任务 就 是 一 个 (usize，&mut [u8]) 元 组 ， 
包含 计算 所 需 的 行 号 和 对 应 的 pixels 中 的 切片 。 这 里 使 用 chunks_mut 方法 把 图 片 缓冲 区 
拆 成 行 ， 而 enumerate 给 每 一 行 添加 行 号 ，collect 再 把 所 有 编号 的 切片 对 收集 到 向 量 中 。 
(因为 Rayon 只 能 基于 数组 或 向 量 创 建 并 行 迭代 器 ， 所 以 这 里 需要 创建 一 个 向 量 。) 

接 下 来 ， 把 bands 转换 为 一 个 并 行 迭 代 器 ， 调 用 .weight_max() 方法 告诉 Rayon 这 些 任 务 
非常 占用 CPU 资源 ， 然 后 再 使 用 .for_each() 方法 告诉 Rayon 我 们 想 完成 什么 工作 。 
因为 要 使 用 Rayon， 所 以 main.rs 中 必须 加 入 以 下 代码 : 


extern crate rayon; 
Use rayon::prelude::*; 


Cargo.toml 也 要 加 入 : 


[dependencies] 
rayon = "0.4" 


经 过 如 此 一 番 修改 ， 程 序 在 8 核 机 器 上 大 约会 使 用 7.75 个 核心 。 因 而 速度 较 之 前 手工 拆 分 
任务 时 会 提升 75%， 而 且 代 码 量 更 少 。 这 反映 出 了 让 包 来 干 活 儿 (分 派 任务 ) 而 不 是 我 们 
自己 干 的 好 处 。 


19.2 通道 

通道 (channel) 是 把 值 从 一 个 线程 发 送 到 另 一 个 线程 的 单 向 管道 。 换 句 话说， 它 是 一 个 线 
程 安全 的 队列 。 

图 19-5 展示 了 通道 的 用 法 。 通 道 与 Unix 中 的 管道 有 点 类 似 ， 都 是 一 端 发 送 数据 ， 另 一 端 接 
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收 数据 ， 而 且 这 两 端 通常 由 不 同 的 线程 所 有 。 但 Unix 管道 发 送 的 是 字 节 ， 而 通道 发 送 的 是 
Rust 值 。sender .send(item) 把 一 个 值 放 进 通道 ，receiver .recv() 则 移 除 一 个 值 。 所 有 权 也 从 
发 送 线程 转移 到 了 接收 线程 。 如 果 通 道 是 空 的 ，receiver.recv() 则 会 一 直 阻 塞 到 有 值 发 送 。 





sender.send(msg) 


receiver.recv() 














19-5: 字符 串通 道 。 字 符 串 msg 的 所 有 权 从 线程 1 转移 到 了 线程 2 


使 用 通道 ， 线 程 可 以 通过 传 值 实现 通信 。 这 是 线程 间 协 作 的 一 种 很 简单 的 方式 ， 无 须 使 用 
锁 或 者 共享 内 存 。 

这 不 是 一 个 新 技术 。Erlang 拥有 隔离 进程 和 消息 传递 已 经 30 年 了 。Unix 管道 也 已 经 存在 
将 近 50 年 了 。 一 般 来 说 ， 我 们 会 将 管道 理解 为 一 种 提供 灵活 性 和 复合 能 力 、 但 不 并 发 的 
特性 ， 而 实际 上 ， 管 道 可 以 实现 上 面 的 所 有 功能 。 图 19-6 展示 了 一 个 Unix 管道 的 示例 ， 
其 中 涉及 的 所 有 3 个 程序 是 完全 可 以 同时 运行 的 。 








grep -h '^=' *.txt | sed 's/=//g' | sort 





读 取 文件 





管道 [人 O 








writes to stdout 





图 19-6，Unix 管道 执行 流程 
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Rust 通道 比 Unit 管道 快 。 发 送 值 是 转移 而 不 是 复制 ， 而 转移 的 值 即 使 数据 结构 包含 儿 兆 数 
据 也 是 很 快 的 。 


19.2.1 发 送 值 


接 下 来 几 节 ， 我 们 会 使 用 通道 构建 一 个 并 发 程序 ， 这 个 程序 会 创建 一 个 倒 排 索引 (inverted 
index) ， 倒 排 索引 是 搜索 引擎 的 关键 要 素 之 一 。 每 个 搜索 引擎 都 工作 在 特定 文档 集合 之 上 。 
倒 排 索引 是 一 种 数据 库 ， 可 以 查询 哪个 关键 词 在 哪里 出 现 过 。 


本 书 中 会 展示 与 线程 和 通道 相关 的 部 分 代码 ， 完 整 代码 可 参见 本 书 在 GitHub 网 站 上 的 页 
面 。 这 个 程序 不 长 ， 总 共 大 约 1000 行 代码 。 

示例 程序 是 按照 管道 的 思路 搭建 的 ， 如 图 19-7 所 示 。 管 道 只 是 使 用 通道 的 多 种 方式 之 一 ， 
后 面 还 会 讨论 其 他 几 种 方式 。 不 过 ， 管 道 是 在 已 有 单线 程 程序 中 加 入 并 发 的 直观 方式 。 




















将 整个 文件 作为 字符 串 


小 型 内 存 索 引 


大 型 内 存 索引 


索引 文件 名 











图 19-7: 索引 构建 器 管道 。 简 头 表 示 通 过 管道 把 值 从 一 个 线程 发 送 到 另 一 个 线程 。 没 有 展 
示 磁 盘 //O 部 分 

这 个 程序 总 共 使 用 了 5 个 线程 来 分 别 完成 不 同 的 任务 。 每 个 线程 在 程序 的 生命 期 内 都 会 不 

断 产 生 输出 。 比 如 ， 第 一 个 线程 负责 从 磁盘 把 源 文档 一 个 接 一 个 地 读 取 到 内 存 中 。( 专 门 

用 一 个 线程 来 做 这 件 事 是 因为 我 们 想 把 代码 写 得 尽量 简单 ， 使 用 的 File::open 和 read_to_ 

string 也 都 是 阻塞 API。 我 们 不 想 在 磁盘 忙碌 时 CPU 却 无 所 事 事 。) 这 一 阶段 的 输出 是 每 

个 文档 对 应 一 个 长 String， 因 此 这 个 线程 与 下 一 个 线程 是 通过 String 通道 连接 的 。 


程序 将 从 启动 读 取 文件 的 线程 开始 。 假 设 documents 保存 的 是 vec<PathBuf>， 即 文档 名 向 
量 。 启 动 读 取 文 件 线程 的 代码 如 下 所 示 : 
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use std::fs::File; 

use std::io::preLude::*; // 为 使 用 Read: :read_to_string 
use std: :thread::spawn; 

use std::sync::mpsc::channel; 





let (sender, receiver) = channel(); 


Let handle = spawn(move || { 
for filename in documents { 
Let mut f = File::open(filename)?; 
let mut text = String::new(); 
f.read_to_string(&mut text)?; 


if sender.send(text).is err() { 
break ; 


} 


} 
Ok(()) 
}); 
通道 是 std: :sync: :mpsc 模块 的 一 部 分 ， 稍 后 再 解释 这 个 名 字 的 含义 。 下 面 来 看 看 代码 的 
工作 过 程 ， 先 从 创建 通道 开始 : 


Let (sender, receiver) = channel(); 


这 里 的 channel 函数 返回 一 对 值 ， 发 送 者 (sender) 和 接收 者 (receiver)。 底 层 实现 是 一 个 
队列 数据 结构 ， 标 准 库 隐藏 了 实现 细 市 。 

通道 是 有 类 型 的 。 我 们 想 使 用 这 个 通道 发 送 每 个 文件 的 文本 ， 因 此 sender 和 receiver 的 
类 型 分 别 是 Sender<String> 和 Receiver<String>。 当 然 ， 也 可 以 显 式 地 声明 要 创建 字符 串 
通道 ， 比 如 这 样 写 : channel: :<String>()。Rust 的 类 型 推断 可 以 做 这 件 事 。 


let handle = spawn(move || { 


跟 以 前 一 样 ， 启 动 线程 要 使 用 std::thread::spawn。sender (而 非 receiver) 的 所 有 权 会 
通过 这 个 move 闭 包 转移 给 新 线程 。 


接 下 来 的 几 行 代码 仅 用 于 从 磁盘 读 取 文 件 : 


for filename in documents { 
let mut f = File::open(filename)?; 
let mut text = String::new(); 
f.read_ to_string(&mut text)?; 


读 取 文件 成 功 后 ， 要 把 其 文本 内 容 发 送 给 通道 


if sender.send(text).is err() { 
break ; 


} 
































} 


sender .send(text) 把 值 text 转移 给 通道 。 最 终 ， 这 个 值 会 被 转移 给 接收 它 的 对 象 。 无 论 
text 包含 的 是 10 行文 本 还 是 10 兆 字 节 ， 这 个 操作 都 只 涉及 复制 3 个 机 器 字 (String 的 大 
小 ) ， 而 对 应 的 receiver.recv() 调用 也 会 只 复制 3 个 机 器 字 。 
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send 和 recyv 方法 都 返回 ResuLt， 但 这 两 种 方法 都 会 在 通道 另 一 端 被 清除 的 情况 下 失败 。 
send 调用 会 在 Receiver 被 清除 时 失败 ， 否 则 值 就 会 在 通道 里 待 一 辈子 : 没有 Recetiver， 
任何 线程 都 没 办 法 接收 它 。 类 似 地 ，recv 调用 会 在 通道 里 没有 待 接收 的 值 且 Sender 被 清 
除 时 失败 ， 否 则 recv 就 要 永远 等 下 去 : 没有 Sender， 任 何 线 程 都 没 办 法 再 发 送 下 一 个 值 。 
清除 通道 端点 是 在 使 用 完 它 之 后 “ 挂 起 ”并 关闭 连接 的 正常 方式 。 
在 我 们 的 代码 中 ，sender .send(text) 只 会 在 接收 者 的 线程 提前 退出 时 失败 。 这 通常 考虑 的 
是 使 用 通道 的 代码 。 无 论 这 种 情况 是 有 意 造 成 的 还 是 错误 导致 的 ， 读 取 线 程 静默 地 关闭 自 
己 是 完全 没 问 题 的 。 
当 这 种 情况 发 生 时 ， 或 者 在 线程 读 取 完 所 有 文档 后 ， 程 序 返 回 0k(()): 
Ok(()) 

}); 
注意 ， 这 个 闭 包 返 回 了 一 个 Resutt。 如 果 线 程 遇 到 了 IO 错误 ， 则 会 立即 退出 ， 而 错误 会 
存储 在 线程 的 JoinHandle 中 。 


当然 ， 与 其 他 编程 语言 一 样 ，Rust 承认 错误 处 理 有 很 多 其 他 的 可 能 方式 。 在 错误 发 生 时 ， 
可 以 通过 println! 将 其 打印 输出 ， 然 后 再 切换 到 下 一 个 文件 ， 也 可 以 使 用 发 送 数据 的 通道 
发 送 错 误 ， 把 通道 作为 Result 通道 ， 或 者 专门 为 错误 再 创建 一 个 通道 。 而 示例 程序 中 采用 
的 方式 既 轻 量 又 可 靠 : ? 操作 符 可 以 避免 大 量 样板 代码 ， 甚 至 像 Java 的 try/catch 那样 的 
错误 处 理 代码 ， 而 且 错 误 也 不 会 静默 传递 。 

为 方便 起 见 ， 我 们 把 所 有 这 些 代码 包装 在 一 个 函数 中 ， 这 个 函数 同时 返回 receiver (还 没 
有 用 到 ) 和 新 线程 的 JoinHandle: 


fn start_file_reader_thread(documents: Vec<PathBuf>) 
-> (Receiver<String>, JoinHandle<io::Result<()>>) 





















































Let (sender, receiver) = channel(); 
Let handle = spawn(move || { 
i 本 
(receiver, handle) 

} 


注意 ， 这 个 函数 启动 新 线程 后 立即 返回 了 。 我 们 会 为 管道 中 每 一 阶段 都 写 一 个 类 似 这 样 的 
国 数 。 


19.2.2 ”接收 值 


本 书 前 面 实现 了 在 一 个 线程 里 循环 发 送 值 。 接 下 来 可 以 再 创建 第 二 个 线程 来 循环 调用 


recetiver .recv() : 


























while Let Ok(text) = receiver.recv() { 
do_something with(text); 
} 
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不 过 Receiver 本 身 是 可 迭代 的 ， 因 此 更 简单 的 方式 是 这 样 写 : 


for text in receiver { 
do_something_with(text); 


} 
这 两 个 循环 是 等 价 的 。 无 论 怎 么 写 ， 妆 控制 流 到 达 循 环 顶 部 时 ， 只 要 通道 恰好 为 空 ， 接 收 
线程 就 会 阻塞 ， 直 到 其 他 线程 发 送 值 。 循 环 会 在 通道 为 空 且 Sender 被 清除 的 情况 下 正常 退 
出 。 在 我 们 的 程序 中 ， 读 取 线 程 退 出 后 循环 会 自然 正常 退出 。 读 取 线 程 会 运行 一 个 闭 包 ， 
该 团 包 拥有 变量 sender ， 闭 包 退 出 时 ，sender 会 被 清除 。 
下 面 来 写 管道 第 二 阶段 的 代码 : 


fn start_fiLLe_indexing_thread(texts: Receiver<String>) 
-> (Receiver<InMemoryIndex>, JoinHandle<()>) 











{ 
let (sender, receiver) = channel(); 
let handle = spawn(move || { 
for (doc_id, text) in texts.into iter().enumerate() { 
let index = InMemoryIndex::from_single_document(doc_id, text); 
if sender.send(index).is err() { 
break; 
} 
} 
]); 
(receiver, handle) 
} 


这 个 函数 创建 了 一 个 线程 ， 该 线程 从 一 个 通道 (texts) 接收 String 值 并 向 另 一 个 通道 
(sender/receiver) 发 送 InMemoryIndex 值 。 这 个 线程 的 工作 是 获取 第 一 阶段 加 载 的 每 个 文 
件 ， 把 每 个 文档 转换 为 一 个 小 型 单 文件 、 驻 内 存 的 倒 排 索引 。 

这 个 线程 的 主 循环 很 好 理解 。 索 引文 档 的 全 部 工作 都 由 from_single_document 函数 完成 。 
这 里 就 不 展示 它 的 源 代 码 了 ， 不 过 把 输入 字符 串 按照 单词 切 分 ， 然 后 再 生成 单词 与 位 置 列 
表 的 映射 并 不 难 。 

这 一 阶段 不 执行 JO， 因 此 不 是 必须 要 处 理 io::Error。 为 此 ， 这 个 国 数 没 有 返回 
io::ResuLt<()>， 而 是 返回 了 ()。 




















19.2.3 ”运行 管道 

剩 下 的 3 个 阶段 在 设计 上 也 是 类 似 的 。 每 个 阶段 都 要 消费 上 一 阶段 创建 的 Receiver。 对 管 
道 的 其 余部 分 ， 我 们 的 目标 是 把 所 有 小 索引 合并 为 一 个 大 索引 文件 ， 然 后 保存 在 磁盘 上 。 
达成 这 个 目标 至 少 需要 3 个 阶段 。 这 里 就 不 再 展示 具体 代码 实现 了 ， 详 情 可 以 查看 在 线 文 
档 。 下 面 只 看 看 这 3 个 阶段 对 应 函数 的 类 型 签名 。 

首先 ， 在 内 存 中 合并 索引 直至 足够 大 (第 三 阶段 ) : 


fn start_in_memory_merge_thread(fiLLe_indexes: Receiver<InMemoryIndex>) 
-> (Receiver<InMemoryIndex>, JoinHandle<()>) 




















然后 ， 把 大 索引 写 入 磁盘 (第 四 阶段 ): 
fn start_index_writer_thread(big_indexes: Receiver<InMemoryIndex>, 
output_dir: &Path) 
-> (Receiver<PathBuf>, JoinHandle<io::Result<()>>) 
最 后 ， 如 果 有 多 个 大 文件 ， 则 使 用 基于 文件 的 合并 算法 将 它们 合并 起 来 (第 五 阶段 ) : 
fn merge index files(files: Receiver<PathBuf>, output dir: &Path) 
-> io::Result<()> 
最 后 这 个 阶段 不 会 返回 Receiver ， 因 为 它 是 管道 的 终点 。 这 个 阶段 会 在 磁盘 上 生成 一 个 输 
出 文件 。 它 也 不 返回 JoinHandle， 因 为 这 个 阶段 也 不 需要 再 创建 线程 了 。 调 用 线程 决定 工 
作 何 时 完成 。 
接 下 来 看 一 看 启动 线程 和 检查 错误 的 代码 : 


fn run_pipeline(documents: Vec<PathBuf>, output_dir: PathBuf) 
-> io: :Result<()> 












































于 


// 启动 管道 的 全 部 5 个 阶段 

let (texts, h1) = start file_ reader_thread(documents); 

let (pints, h2) = start_file_indexing_thread(texts); 

Let (gallons, h3) = start_in memory_merge_thread(pints); 

Let (files, h4) = start_index_ writer_thread(gallons, &output dir); 
Let result = merge index files(files, &output dir); 


// 等 待 线程 完成 ， 保 存 碰 到 的 任何 错误 
let rl = hi1.join().unwrap(); 
h2.join().unwrap(); 
h3.join().unwrap(); 

let r4 = h4.join().unwrap(); 





// 返回 遇 到 的 第 一 个 错误 (如果 有 的 话 ) 。 

// 此 时 ，h2 和 h3 不 会 失败 ， 因 为 这 些 线程 是 纯 内 存 数据 处 理 。) 
FE? 

r4?; 

result 











} 


跟 以 前 一 样 ， 使 用 .join().unwrap() 显 式 地 把 许 异 从 子 线程 传播 到 主线 程 。 不 同 之 处 是 这 
里 没有 马上 使 用 ?， 而 是 把 io: :Resutt 值 放 在 一 边 ， 直 到 4 个 线程 全 部 合并 完成 。 


相 比 于 单线 程 设备 ， 这 个 管道 要 快 40%。 对 于 一 个 下 午 就 能 完成 的 工作 来 说 ， 这 个 结果 还 
不 错 。 但 相 比 于 曼 德 布 洛 特 程序 几乎 75% 的 提速 就 有 点 相形 见 红 了 。 显 然 ， 我 们 不 是 没有 
充分 利用 系统 的 IO 容量 ， 就 是 没有 充分 利用 所 有 的 CPU 内 核 。 这 是 怎么 回 事 呢 ? 


管道 与 制造 工厂 的 流水 线 类 似 ， 其 整体 性 能 受 限于 最 慢 阶 段 的 生成 能 力 。 全 新 的 、 没 有 调 
优 过 的 流水 线 可 能 跟 装 配 单 件 产 品 一 样 慢 。 但 流水 线 的 优势 在 定向 调 优 后 会 发 挥 出 来 。 在 
我 们 的 例子 中 ， 数 据 显示 第 二 个 阶段 是 产 项 。 索 引线 程 使 用 的 是 .to_Lowercase() 和 .is_ 
alphanumeric()， 因 此 要 在 搜索 Unicode 表 上 花费 很 多 时 间 。 索 引 之 后 的 下 游 阶 段 把 大 多 
数 时 间 花 在 了 Receiver::recv 休眠 、 等 待 输入 上 。 
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这 意味 着 还 可 以 更 快 。 只 要 解决 瓶颈 问题 ， 并 行 度 就 可 以 提升 。 现 在 ， 我 们 已 经 知道 如 何 
使 用 通道 ， 而 我 们 的 程序 也 由 隔离 的 代码 片段 构成 ， 因 此 很 容易 找到 解决 第 一 个 瓶颈 的 方 
法 。 可 以 手工 优化 第 二 阶段 的 代码 ， 就 像 优化 其 他 代码 一 样 ， 可 以 把 工作 拆 分 成 两 个 或 更 
多 个 阶段 ， 或 者 同时 运行 多 个 文件 索引 线程 。 


19.2.4 通道 特性 与 性 能 

std::sync::mpsc 中 的 mpsc 指 的 是 “multi-producer, single-consumer”( 多 生产 者 ， 单 消费 
者 )， 是 对 Rust 通道 所 提供 通信 特性 的 简洁 概括 。 

示例 程序 中 的 通道 只 从 一 个 发 送 者 取 值 ， 发 送 给 一 个 接收 者 。 这 是 相当 常见 的 情况 。 但 
Rust 通道 也 支持 多 个 发 送 者 ， 此 时 由 一 个 线程 处 理 来 自 多 个 客户 端 线程 的 请 求 ， 如 图 19-8 
所 示 。 














图 19-8: 一 个 通道 接收 多 个 发 送 者 的 请 求 


Sender<T> 实现 了 Clone 特 型 。 要 获得 一 个 有 多 个 发 送 者 的 通道 ， 只 需 创建 一 个 常规 通道 ， 
然后 再 克隆 发 送 者 ， 需 要 多 少 就 克隆 多 少 。 可 以 把 每 个 sender 值 转移 到 不 同 的 线程 。 


Receiver<T> 无 法 克隆 ， 因 此 如 果 需 要 多 个 线程 从 同一 个 通道 接收 值 ， 就 需要 使 用 Mutex。 
本 章 后 面 会 就 此 给 出 例子 。 


Rust 通道 是 经 过 认真 优化 的 。 在 刚 创 建 通道 时 ，Rust 使 用 的 是 “一 次 性 ”队列 实现 。 如 果 
只 是 用 这 个 通道 发 送 一 个 对 象 ， 那 可 以 保证 开销 最 小 。 如 果 再 发 送 第 二 个 值 ，Rust 则 会 切 
换 到 一 个 不 同 的 队列 实现 。 这 个 实现 会 从 长 远 考 虑 ， 准 备 让 通道 传输 很 多 值 ， 同 时 又 保持 
分 配 开销 最 小 化 。 如 果 你 选择 克隆 Sender ，Rust 则 必须 回 退 到 另外 一 个 实现 ， 该 实现 可 以 
保证 多 个 线程 同时 发 送 值 时 的 安全 。 不 过 即使 是 这 3 个 实现 中 最 慢 的 实现 也 是 没有 锁 的 队 
列 ， 因 此 发 送 和 接收 值 最 多 只 是 几 个 原子 操作 ， 涉 及 一 次 堆 内 存 分 配 ， 外 加 转移 自身 。 只 
有 在 队列 为 空 且 接 收 线程 因此 需要 休眠 时 才 需 要 系统 调用 。 当 然 ， 此 时 经 过 通道 的 流量 无 
论 如 何 也 不 是 最 大 的 。 


除了 上 述 这 些 优化 工作 ， 对 应 用 程序 来 说 ， 还 有 一 个 在 通道 性 能 方面 很 可 能 会 犯 的 错误 : 
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发 送 值 的 速度 超过 接收 和 处 理 值 的 速度 。 这 会 导致 通道 内 部 的 值 越 积 越 多 。 例 如 ， 对 我 们 
的 程序 而 言 ， 我 们 发 现 文件 读 取 器 线程 (阶段 一 ) 加 载 文件 的 速度 可 能 远 快 于 文件 索引 线 
程 (阶段 二 ) 索引 它们 的 速度 。 结 果 导 致 从 磁盘 读 取 了 几 百 兆 字 节 的 原始 数据 ， 一 次 性 全 
装 进 了 队列 里 。 
这 种 错误 占用 内 存 且 损 害 局 部 性 。 更 糟糕 的 是 ， 如 果 发 送 线程 一 直 运 行 ， 则 会 耗 尽 CPU 
和 其 他 系统 资源 以 发 送 更 多 值 ， 而 接收 端 此 时 正 急 需 这 些 资 源 却 得 不 到 。 

这 里 Rust 同样 借鉴 了 Unix 管道 。Unix 使 用 了 一 种 优雅 的 技巧 来 提供 某 种 反 压 力 
(backpressure)， 从 而 强迫 快速 发 送 端 放 慢 速度 。Unix 系统 的 每 个 管道 都 有 固定 大 小 ， 如 
果 一 个 进程 尝试 向 随时 可 能 满 的 管道 写 入 数据， 系统 就 会 直接 阻塞 该 进程 ， 直 至 管道 中 有 
了 空间 。Rust 中 的 等 价 机 制 叫 同步 通道 (synchronous channel) 。 


use std::sync::mpsc::sync_channel; 














let (sender, receiver) = sync_channel(1000); 


同步 通道 就 像 常 规 通 道 一 样 ， 只 是 在 创建 时 需要 指定 它 可 以 保存 多 少 值 。 对 于 同步 通道 而 
言 ，sender.send(value) 是 一 个 入 在 的 阻塞 操作 。 毕 竟 ， 阻 塞 也 不 总 是 坏事 。 在 示例 程序 
中 ， 当 把 start_file_reader_thread 中 的 channel 改 为 可 以 保存 32 个 值 的 sync_channet 后 ， 
根据 我 们 使 用 基准 数据 测试 ， 在 保持 吞吐 量 不 变 的 情况 下 ， 可 以 降低 三 分 之 二 内 存 占 用 。 


19.2.5 ”线程 安全 : Send 与 Sync 


目前 为 止 ,我 们 一 直 假 定 所 有 值 都 可 以 在 进程 间 自 由 转移 和 共享 。 大 多 数 情况 下 确实 如 此 ， 
但 Rust 代码 的 彻底 安全 取决 于 两 个 内 置 特 型 ， std::marker::Send 和 std::marker::Sync。 


实现 send 的 类 型 可 以 安全 地 把 值 传 到 另 一 个 线程 ， 即 它们 可 以 在 线程 间 转 移 。 
实现 Sync 的 类 型 可 以 安全 地 把 不 可 修改 引用 传 到 另 一 个 线程 ， 即 它们 可 以 在 线程 间 


共享 。 


这 里 所 谓 的 安全 ， 就 是 我 们 一 直 反 复 强 调 的 意思 : 没有 数据 争 用 和 其 他 未 定义 行为 。 
例如 ， 在 19.1.1 节 process_files_in_parallel 的 例子 中 ， 我 们 使 用 闭 包 从 父 线 程 向 每 个 子 
线程 传 了 一 个 Vec<String>。 当 时 并 没有 指出 这 一 点 ， 但 这 意味 着 向 量 及 其 字符 串 的 分 配 
是 在 父 线程 中 ， 释 放 则 在 子 线程 中 。 由 于 vec<String> 实现 了 Send， 因 此 API 可 以 保证 这 
是 没 问题 的 ， 即 vec 内 部 使 用 的 分 配 程序 和 String 是 线程 安全 的 。 


《如 果 使 用 快速 但 非 线 程 安 全 的 分 配 程序 来 写 自己 的 vec 和 String 类 型 ， 那 就 必须 使 
用 非 Send 类 型 实现 它们 ， 例 如 不 安全 的 指针 。Rust 可 以 推断 出 你 的 非 线 程 安 全 的 向 量 
NonThreadSafevec 和 非 线 程 安全 的 字符 串 NonThreadSafeString 不 是 Send， 并 限制 它们 只 
能 在 单线 程 中 使 用 。 但 这 种 情况 很 少见 。) 

如 图 19-9 所 示 ， 大 多 数 类 型 既是 Send 也 是 Sync。 在 程序 中 ， 甚 至 都 不 必 使 用 \#[derive] 
为 结构 体 和 枚 举 来 实现 这 两 个 特 型 。Rust 会 自动 帮 你 实现 。 结 构 体 或 枚 举 的 字段 如 果 是 
Send， 那 它们 也 是 Send; 如 果 是 Sync， 那 它们 也 是 Sync。 
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bool 

&str 
String 
TCPStream 


HashMap<String, usize> 






Cell<usize> 






Receiver<u8> 


@4——————————————————— Rc<string> 
二 mutu8 








19-9: Send 和 Sync 类 型 





少数 没有 实现 Send 和 Sync 的 类 型 主要 用 于 在 非 线程 安全 的 条 件 下 提供 可 修改 能 力 。 例 如 
引用 计数 智能 指针 类 型 std: : rc: :Rc<T>。 

如 果 可 以 在 线程 间 共 享 Rc<String> 会 导致 什么 问题 ? 如果 两 个 线程 恰好 同时 克隆 这 个 
Rc， 如 图 19-10 所 示 ， 就 会 出 现 数据 争 用 ， 因 为 两 个 线程 都 会 增加 共享 引用 计数 。 结 果 
引用 计数 可 能 会 变 得 不 准确 ， 从 而 导致 将 来 的 “释放 后 还 使 用 ”或 双重 释放 ， 这 都 是 未 
定义 行为 。 

















19-10: 为 什么 Rc<String> 既 不 是 Sync 也 不 是 Send 
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当然 ，Rust 会 阻止 这 样 做 。 以 下 代码 故意 造成 了 数据 争 用 : 


use std::thread::spawn; 
use std::rc::Rc; 





fn main() { 
let rc1 = Rc::new("hello threads".to_string()); 
let rc2 = rci.clone(); 


spawn(move || { // 错误 
rc2.clone(); 


2 


rci.clone(); 


} 
Rust 拒绝 编译 这 段 代码 ， 并 给 出 了 详细 的 错误 消息 : 


error[E0277]: the trait bound ‘Rc<String>: std::marker::Send`” is not satisfied 
in ‘[closure@...]. 
--> Concurrency_send_rc.rs:10:5 


10 spawn(move || { // 错误 


| 
| 
| ^^^^A^ within “[closure@...]', the trait “std::marker::Send. is not 
| implemented for ‘Rc<String>. 
| 


note: ‘Rc<String>. cannot be sent between threads safely 
note: required because it appears within the type ‘“[closure@...]. 
note: required by ‘std::thread::spawn. 


现在 ,我 们 已 经 知道 Send 和 Sync 可 以 帮助 Rust 实现 线程 安全 。 在 跨 线 程 传输 数据 的 函数 
如 spawn 中 ， 它 们 都 会 作为 绑 定 出 现在 类 型 签名 中 。 在 通过 spawn 创建 线程 时 ， 传 人 的 闭 
包 必 须 是 Send。 这 意味 着 它 所 包含 的 所 有 值 都 必须 是 Send。 类 似 地 ， 如 有 果 要 把 值 从 通道 中 
发 送 给 另 一 个 线程 ， 那 这 个 值 也 必须 是 Send。 


19.2.6 ”将 所 有 迭代 器 都 接 到 通道 上 


我 们 示例 中 的 倒 排 索引 构建 器 是 作为 一 个 管道 来 构建 的 。 代 码 本 身 一 目 了 然 ， 但 需要 手工 
创建 通道 并 启动 线程 。 相 比 之 下 ， 第 15 章 构 建 的 迭代 器 管道 好 像 是 把 很 多 工作 打包 到 了 
寥寥 几 行 代码 中 。 可 以 为 线程 管道 构建 类 似 的 东西 吗 ? 
事实 上 ， 如 果 可 以 统一 从 代 器 管道 和 线程 管道 当然 很 好 。 这 样 索引 构建 器 就 可 以 写成 迄 代 
器 管道 了 。 可 能 一 开始 是 这 样 的 : 

documents.into_iter() 


.map(read_whole_file) 
.errors_to(error_sender) // 过 滤 错 误 结果 


















































.off_thread() // 为 上 面 的 工作 创建 一 个 线程 
.map(make_single file index) 





.off_thread() // 为 阶段 二 创建 另 一 个 线程 


特 型 支持 给 标准 库 类 型 添加 方法 ， 因 此 实际 上 我 们 可 以 做 到 这 样 。 为 此 首先 要 写 一 个 特 
型 ， 声 明 想 要 的 方法 : 
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Use std: :Sync::mpscy; 


pub trait OffThreadExt: Iterator { 
/// 把 这 个 进 代 器 转换 为 一 个 分 离线 程 迭 代 器 : 
/// 在 一 个 独立 的 工作 线程 上 调用 next( )， 
/// 因此 这 个 迭代 器 和 循环 体 是 并 发 运行 的 
fn off_thread(self) -> mpsc::IntoIter<SeLf::Item>; 














} 
然后 为 迭代 器 类 型 实现 这 个 特 型 。mpsc: :Receiver 已 经 是 可 进 代 类 型 ， 因 此 会 方便 一 些 。 
use std::thread::spawn; 


impl<T> OffThreadExt for T 
where T: Iterator + Send + 'static, 
T::Item: Send + 'static 
{ 
fn off_thread(self) -> mpsc::IntoIter<Self::Item> { 
// 创建 一 个 通道 并 将 工作 线程 中 的 项 传 出 来 


Let (sender, receiver) = mpsc::sync channel(1024); 





























// 把 这 个 迭代 器 转移 到 一 个 新 线程 中 并 在 那里 运行 它 
spawn(move || { 
for item in self { 
if sender.send(item).is err() { 
break; 
} 
} 
上; 
// 返回 一 个 从 通道 提取 值 的 迭代 器 
receiver .into_iter() 





} 
代码 中 的 where 子 句 是 通过 非常 类 似 于 11.5 节 描 述 的 一 个 流程 来 确定 的 。 一 开始 只 有 以 下 
这 些 内 容 : 

impl<T: Iterator> OffThreadExt for T 
这 也 就 是 说 ， 我 们 希望 这 个 实现 适用 于 所 有 返 代 器 。Rust 并 没有 实现 这 个 。 因 为 我 们 使 
用 spawn 把 一 个 类 型 T 的 迭代 器 转移 到 了 新 线程 ， 所 以 必须 指定 T: Iterator + Send + 
'static。 因 为 要 把 项 从 通道 中 传 出 来 ， 所 以 必须 指定 T::Item: Send + 'static。 有 了 这 
些 绑 定 ，Rust 就 没有 意见 了 。 
下 面 简单 总 结 一 下 Rust 的 性 格 : 我 们 可 以 随意 给 语言 的 所 有 迭代 器 添加 并 发 能 力 ， 但 前 提 
是 必须 理解 并 明确 指定 保证 它们 安全 使 用 的 限制 。 


19.2.7 ”超越 管道 


本 节 以 管道 为 例 ， 因 为 管道 是 使 用 通道 的 一 个 既 自 然 又 明显 的 方式 。 所 有 人 都 能 理解 管道 
和 通道 ， 因 为 它们 具体、 实际 且 具 有 确定 性 。 不 过 ， 通 道 不 仅 在 管道 中 有 用 ， 它 们 也 是 在 
相同 进程 中 为 其 他 线程 提供 异步 服务 的 快速 而 简单 的 方式 。 


























假设 你 想 用 一 个 线程 来 记录 日 志 ， 如 图 19-8 所 示 的 那样 。 其 他 线程 可 以 借助 通道 向 日 志 线 
程 发 送 消 息 。 因 为 可 以 克隆 通道 的 Sender ， 所 以 很 多 客户 端 线程 可 以 有 向 同一 个 日 志 线 程 
投递 消息 的 发 送 者 。 

在 自己 的 线程 上 运行 类 似 记录 日 志 这 样 的 服务 有 很 多 好 处 。 日 志 线 程 可 以 在 必要 时 更 杰 日 
志文 件 。 为 此 ， 它 无 须 与 其 他 线程 有 过 多 沟通 。 那 些 线程 不 会 被 锁定 。 消 息 可 以 无 害 地 在 
通道 中 累积 片刻 ， 直 到 日 志 线 程 恢复 工作 。 


通道 也 适用 于 一 个 线程 向 另 一 个 线程 发 送 请 求 并 期 待 得 到 某 种 响应 的 情形 。 第 一 个 线程 的 
请 求 可 以 是 一 个 结构 体 或 元 组 ， 包 含 一 个 Sender， 一 个 标明 肥 信 地 如 的 入 到， 以 便 第 二 
个 线程 用 它 回 寄 响 应 。 这 并 不 意味 着 交互 必须 同步 。 第 一 个 线程 决定 是 阻塞 并 等 待 响 应 ， 
还 是 使 用 .try_recv() 方法 轮 询 结果 。 


目前 为 止 我 们 展示 了 针对 适合 高 度 并 行 计算 任务 的 分 又 -合并 ， 还 有 适合 松散 连接 组 件 的 
通道 。 这 两 种 并 发 机 制 可 以 满足 很 多 应 用 的 需求 。 但 本 章 内 容 不 止 这 些 ， 下 面 继续 。 


19.3 ”共享 可 修改 状态 


在 第 8 章 发 布 fern_sin 包 儿 个 月 之 后 ， 你 的 蕨 类 植物 模拟 程序 已 经 真正 走红 了 。 现 在 ， 你 
打算 再 写 一 个 多 人 实时 策略 游戏 ， 让 8 个 玩家 在 模拟 的 侏 罗 纪 世界 中 比赛 种 植 生长 周期 接 
近 真 实 世 界 的 蕨 类 植物 。 这 个 游戏 的 服务 器 是 一 个 大 规模 并 行 应 用 ， 拥 有 来 自 众 多 线程 的 
大 量 请 求 。 在 8 个 玩家 都 上 线 之 后 ， 这 些 线程 之 间 是 如 何 协 调 来 开始 游戏 的 ? 


这 里 要 解决 的 问题 是 很 多 线程 需要 访问 等 待 加 入 游戏 的 玩家 的 共享 列表 。 这 个 数据 必须 在 
所 有 线程 中 都 可 以 修改 且 共 享 。 如 果 Rust 没有 共享 的 可 修改 状态 ， 那 该 怎么 办 呢 ? 


可 以 为 此 创建 一 个 新 线程 ， 其 全 部 工作 就 是 管理 这 个 列表 。 其 他 线程 可 以 使 用 通道 与 其 通 
信 。 当 然 ， 这 要 占用 一 个 需要 一 些 操作 系统 开销 的 线程 。 


男 一 个 选项 是 使 用 Rust 为 安全 地 共享 可 修改 数据 所 提供 的 工具 。 没 错 ， 确 实 有 这 个 选项 。 
它们 就 是 所 有 熟悉 线程 的 系统 程序 员 都 知道 的 低级 元 语 。 本 市 会 介绍 互 斥 量 、 读 / 写 锁 、 
条 件 变量 和 原子 整数 。 最 后 会 展示 如 何在 Rust 中 实现 全 局 可 修改 变量 。 


19.3.1 什么 是 互 斥 量 


互 斥 量 (或 者 叫 锁 ) 用 于 强制 多 线程 依次 访问 特定 的 数据 。 下 一 节 会 介绍 Rust 的 互 斥 量 。 
首先 ， 有 必要 回忆 一 下 其 他 语言 中 的 互 斥 量 是 什么 样 的 。 下 面 是 在 C++ 中 简单 使 用 互 斥 量 
的 一 个 场景 : 

// C++ 代码 ， 不 是 Rust 


void FernEngine::JoinWaitingList(PlayerId pLayer) { 
mutex.Acquire(); 





















































waitingList.push_back(player); 


// 如 果 等 待 的 玩家 满足 条 件 则 开始 游戏 
if (waitingList.length() >= GAME_SIZE) { 
Vector<PLayerId> players; 
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waitingList.swap(players); 
StartGame(players); 


mutex.Release(); 


} 


代码 中 调用 mutex.Acquire() 和 mutex.ReLease() 的 语句 是 临界 区 (critical section) 的 开始 
和 结束 。 对 程序 中 的 每 个 mutex， 每 次 只 有 一 个 线程 可 以 在 临界 区 中 运行 。 如 果 临界 区 中 
有 一 个 线程 ， 则 所 有 调用 mutex.Acquire() 的 其 他 线程 都 会 被 阻塞 ， 直 至 第 一 个 线程 调用 


mutex.ReLease()。 


我 们 说 ， 互 斥 量 保护 数据 。 对 这 里 而 言 ， 就 是 mutex 保护 waitingList。 不 过 ， 确 保 每 个 线 
程 在 访问 数据 前 获得 互 斥 量 ， 之 后 再 释放 它 则 是 程序 员 的 责任 。 
互 斥 量 的 作用 体现 在 以 下 几 方 面 。 


。 防止 数据 争 用 ， 即 避免 多 个 线程 并 发 读 写 同 一 块 内 存 。 数 据 争 用 在 C++ 和 Go 中 属于 未 定 
义 行为 。Java 和 C# 等 托管 语言 承诺 不 会 月 江 ,但 数据 争 用 的 结果 仍然 (说 到 底 ) 没有 意义 。 
即使 没有 数据 争 用 ， 即 使 所 有 读 写 在 程序 中 都 是 顺序 执行 ， 如 果 没 有 互 矿 量 ， 不 同 线程 
的 操作 也 可 能 以 任意 方式 相互 交错 。 想 象 一 下 在 其 他 线程 可 以 修改 你 程序 数据 的 情况 下 
写 代码 的 情景 。 再 想象 一 下 怎么 调试 这 个 程序 。 这 样 的 程序 就 好 像 中 政 了 。 

。 互 斥 量 支持 通过 不 变性 (invariant) 编程 ， 即 受 保护 数据 由 你 负责 初始 化 但 由 每 个 临界 
区 来 维护 的 规则 。 

当然 ， 所 有 这 些 实际 上 都 基于 相同 的 原因 : 不 受 控 的 争 用 情形 会 导致 编程 困难 。 互 斥 量 为 

混乱 中 引入 了 秩序 (尽管 没有 通道 或 分 又 -合并 那么 有 秩序 )。 

不 过 ， 在 大 多 数 语 言 中 ， 互 斥 量 很 容易 搞 乱 套 。 在 C++ 中 (在 其 他 大 多 数 语 言 中 也 一 样 )， 

数据 和 锁 是 两 个 独立 对 象 。 理 想 情 况 下 ， 注 释 会 解释 每 个 线程 必须 在 触 碰 数 据 前 先 获 得 互 

斥 量 : 


class FernEmpireApp { 




















































































































private: 
// 等 待 加 入 游戏 的 玩家 列表 。 通 过 mutex 来 保护 


Vector<PLayerId> waitingList; 


// 在 读 写 waitingList 之 前 必须 先 获 得 锁 
Mutex mutex; 


下 
即使 有 了 这 些 贴 心 的 注释 ， 编 译 器 照样 无 法 保证 这 里 的 安全 访问 。 如 果 一 段 代 码 忘 了 先 获 
得 互 斥 量 ， 就 会 出 现 未 定义 行为 。 实 践 中 ， 这 意味 着 极 难 重 现 和 修复 的 错误 。 
就 算 在 Java 中 对 象 和 互 斥 量 之 间 存 在 某 些 概念 上 的 关联 ， 但 这 种 关联 仍然 不 够 牢固 。 编 译 
器 会 尝试 保持 这 种 关联 性 。 而 在 实践 中 ， 由 锁 保护 的 数据 很 少 恰好 是 关联 对 象 的 字段 ， 其 
中 经 常 包 含 来 自 多 个 对 象 的 数据 。 锁 机 制 照 样 难以 捉摸 。 因 此 注释 仍然 是 落实 这 种 关联 的 
主要 工具 。 




















人 
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19.3.2 Mutex<T> 


现在 来 看 看 在 Rust 中 如 何 实现 等 待 列 表 。 在 我 们 的 “ 蕨 类 帝国 ”(Fer Empire) 游戏 服务 
器 上 ， 每 个 用 户 都 有 一 个 唯一 的 ID 


type PLayerId = U32; 
等 待 列 表 就 是 一 个 玩家 ID 的 集合 


const GAME_SIZE: usize = 8; 








/// 等 待 列表 不 会 超过 GAME_SIZE 个 玩家 
type WaitingList = Vec<PLayerId>; 
等 待 列表 作为 FernEmpireApp 的 一 个 字段 来 保存 ， 它 是 在 服务 器 启动 时 在 Arc 中 初始 化 的 
一 个 单 例 对 象 。 每 个 线程 都 有 一 个 指向 它 的 Arc。 它 包含 所 有 共 
东西 ， 其 中 大 多 数 是 只 读 的 。 因 为 等 待 列表 既是 共享 的 也 是 可 修改 的 ， 所 以 必须 由 一 
Mutex 来 提供 保护 : 


use std::sync::Mutex; 





























/// 所 有 线程 都 可 以 共享 访问 这 个 大 上 下 文 结构 体 
struct FernEmpireApp { 


waiting_list: Mutex<WaitingList>, 


} 
与 C++ 不 同 ，Rust 中 受 保护 的 数据 保存 在 utex 内 部 。 创 建 hutex 的 代码 是 这 样 的 ; 
let app = Arc::new(FernEmpireApp { 


waiting_list: Mutex::new(vec![]), 


5 


创建 一 个 新 Mutex 就 像 创 建 一 个 新 Box 或 Arc， 但 Box 和 Arc 都 意味 着 堆 分 配 ， 而 Mutex 就 
人 种 锁 。 如 果 想 把 Mutex 分 配 在 堆 上 ， 则 必须 明确 地 表示 出 来 ， 就 像 这 里 使 用 

: :new 创建 整个 应 用 ， 而 使 用 Mutex: :new 只 是 为 了 保护 数据 一 样 。 这 两 个 类 型 经 常 一 块 
加 Arc 方便 跨 线 程 共享 数据 ， 而 Mutex 方便 跨 线 程 共享 可 修改 数据 。 


接 下 来 实现 使 用 这 个 互 斥 量 的 join_waiting_list 方法 : 


impl FernEmpireApp { 
/// 向 等 待 列 表 中 为 下 一 个 游戏 添加 一 名 玩家 
/// 如 果 等 待 的 玩家 够 了 就 立即 启动 新 游戏 
fn join waiting list(&self, player: PlayerId) { 
// 锁 住 互 斥 量 并 获得 数据 访问 权 
// 这 里 guard 的 作用 域 是 临界 区 
Let mut guard = seLf.waiting_List.Lock().unwrap(); 






































// 现在 执行 游戏 逻辑 
guard.push(player); 
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if guard.len() == GAME_SIZE { 
let players = guard.split off(0); 
seLf .start_game(pLayers ) ; 


} 
} 


取得 数据 唯一 的 方式 是 调用 .lock() 方法 : 
Let mut guard = seLf.waiting_List.Lock().unwrap(); 
self.waiting_list.lock() 会 一 直 阻 塞 到 可 以 再 次 获得 互 斥 量 。 这 个 方法 调用 返回 的 
MutexGuard<WaitingList> 值 是 对 &mut MaitingList 的 一 个 简单 封装 。 借 助 13.5 节 介 绍 的 
Deref 类 型 转换 ， 可 以 直接 在 这 个 守卫 (guard) 上 调用 WaitingList 方法 : 
guard.push(player); 
这 个 守卫 其 至 还 允许 我 们 直接 引用 底层 数据 。Rust 的 生命 期 系统 保证 这 些 引 用 的 寿命 不 会 
超出 守卫 自身 。 如 果 没 有 拿 到 锁 ， 则 不 可 能 在 Mutex 中 访问 数据 。 
在 guard 被 清除 后 ， 锁 也 会 被 释放 。 通 常 这 会 在 阻塞 结束 时 发 生 ， 但 也 可 以 手工 清除 ; 


if guard.len() == GAME_SIZE { 
let players = guard.split off(0); 
drop(guard); // 开始 游戏 时 ， 清 除 守 了 
seLf .start_game(pLayers); 








[oO 


19.3.3 mut 与 Mutex 


join_waiting_list 方法 没有 以 self 的 mut 引用 作为 参数 ， 这 好 像 有 点 奇怪 〈 乍 一 看 确实 
是 很 奇怪 ) 。 这 个 方法 的 类 型 签名 是 : 


fn join waiting list(&self, player: PlayerId) 


底层 集合 vec<PLayerId> 确实 需要 一 个 mut 引用 才能 调用 push 方法 ， 其 类 型 签名 为 : 


pub fn push(&mut self, item: T) 


























可 是 这 个 代码 还 是 可 以 编译 运行 。 到 底 怎么 回 事 ? 
在 Rust 中 ，mut 意味 着 专 有 /排他 访问 (exclusive access)。 非 mut 才 意 味 着 共享 访问 


(shared access ) 。 


我 们 已 经 习惯 了 从 父 线 程 向 子 线程 、 从 容器 向 内 容 传递 mut 引用 。 如 果 你 本 来 就 有 对 
starships 的 mut 引用 (或 者 拥有 starships 的 所 有 权 ， 此 时 要 蕉 喜 你 成 为 Elon Musk) ， 就 
可 以 在 starships[id].engine 上 调用 mut 方法 。 这 是 默认 行为 ， 因 为 如 果 在 父 上 下 文中 设 
有 专 有 访问 权 ， 那 Rust 通常 设法 保证 你 在 子 上 下 文中 有 专 有 访问 权 。 


但 Mutex 有 一 个 办 法 : 锁 。 事 实 上 ， 互 斥 量 就 是 一 个 锁 ， 它 提供 对 其 中 数据 的 专 有 (mut) 
访问 权 ， 即 使 很 多 线程 有 对 Mutex 本 身 的 共享 ( 非 mut) 访问 权 。 




















Rust 的 类 型 系统 会 告诉 我 们 Mutex 做 了 什么 ， 它 动态 控制 专 有 访问 。 而 这 通常 是 由 Rust 编 
译 器 在 编译 时 静态 完成 的 。 


(你 可 能 还 记得 std::cell: :Refcell 也 会 这 样 做 ， 只 不 过 没有 考虑 支持 多 线程 。mutex 和 
RefCett 都 是 内 部 修改 能 力 的 体现 ，9.9 节 曾 介绍 过 。) 


19.3.4 互 斥 量 的 问题 

在 讨论 互 斥 量 之 前 ， 本 书 先 介 绍 了 几 种 实现 并 发 的 方式 ， 而 这 些 方式 即使 在 C++ 中 也 可 以 
轻松 正确 地 使 用 。 这 并 非 巧合 ， 因 为 这 些 方式 对 解决 并 发 编程 最 令 人 头疼 的 问题 是 非常 安 
全 且 有 保证 的 。 只 依赖 并 行 分 又 - 合并 的 程序 具有 确定 性 ， 不 可 能 死 锁 。 而 使 用 通道 的 程 
序 几 乎 也 不 会 出 什么 问题 。 专 门 使 用 通道 实现 管道 操作 的 程序 (比如 前 面 示例 中 的 索引 构 
建 器 ) 也 具有 确定 性 ， 虽 然 消 息 传输 的 时 间 可 能 不 同 ， 但 并 不 影响 输出 。 还 有 很 多 这 样 的 
例子 。 多 线程 程序 的 安全 有 保证 是 很 令 人 欣慰 的 。 


Rust 中 Mutex 的 设计 几乎 肯定 可 以 让 你 比 以 往 任何 时 候 都 能 更 系统 、 更 明智 地 使 用 互 斥 
量 。 但 是 有 必要 停 下 脚步 ， 思 考 一 下 Rust 的 安全 保证 什么 时 候 有 用 ， 什 么 时 候 帮 不 上 忙 。 


安全 的 Rust 代码 不 会 触发 数据 争 用 ， 即 多 线程 并 发 读 取 同 一 块 内 存 导致 产生 无 意义 的 结 
果 。 这 非常 好 ， 数 据 争 用 之 无 疑问 是 个 问题 ， 而 且 在 实际 的 多 线程 程序 中 也 并 不 鲜 见 。 


可 是 ， 使 用 互 斥 量 的 线程 也 会 伴 有 其 他 一 些 Rust 无 法 帮 有 我 们 解决 的 问题 。 


。 有 效 的 Rust 程序 不 会 出 现 数据 争 用 ,但 仍然 可 能 存在 竞 态 条 件 (race condition) ， 即 程 
序 行为 取决 于 线程 的 执行 时 间 ， 因 此 每 次 运行 的 结果 可 能 都 不 相同 。 有 些 竞 态 条 件 是 良 
性 的 ， 有 些 则 表现 为 常见 且 极 难 修复 的 bug。 以 非 结构 化 方式 使 用 互 斥 量 会 导致 觉 态 条 
件 。 确 保 竞 态 条 件 是 良性 的 由 你 决定 。 

。 共享 的 可 修改 状态 也 会 影响 程序 设计 。 通 道 作 为 代码 中 抽象 的 边界 为 隔离 组 件 、 方 便 测 
试 提 供 了 基础 ， 而 互 斥 量 鼓 励 “ 添 加 一 个 方法 ” 式 的 解决 问题 的 思路 ， 这 种 思路 会 导致 
纠缠 不 清 难 以 剥离 的 代码 。 

。 最 后 ， 互 斥 量 并 不 像 它们 乍 看 起 来 那么 简单 ， 接 下 来 的 两 节 会 进一步 讨论 。 

所 有 这 些 问题 都 是 工具 本 身 所 固有 的 。 记 住 ， 要 尽 可 能 使 用 结构 化 方式 ， 而 在 必需 时 再 使 

用 Mutex。 













































































19.3.5” 死 锁 
线程 在 尝试 获取 自己 已 经 持 有 的 锁 时 可 能 会 造成 死 锁 : 


Let mut guard1 
let mut guard2 


假设 第 一 次 调用 self .waiting_List ,Lock() 成 功 ， 取 得 了 锁 。 第 二 次 调用 发 现 锁 已 经 被 持 
有 了 ， 因 此 就 会 阻塞 ， 等 待 释放 。 于 是 它 就 会 永远 等 待 下 去 。 这 个 等 待 线 程 就 是 持 有 锁 的 
线程 。 


从 另 一 个 角度 说 ，Mutex 中 的 锁 不 是 递归 锁 。 


self.waiting_ list.lock().unwrap(); 
self.waiting_list.lock().unwrap(); // 死 锁 
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这 里 代码 的 问题 很 明显 。 在 真实 程序 里 ， 两 次 Lock() 调用 可 能 出 现在 不 同方 法 中 ， 其 中 一 
个 会 调用 另 一 个 。 单 独 来 看 ， ee 还 有 其 他 情况 可 能 导致 死 锁 ， 比 如 
多 个 线程 同时 获取 多 个 互 斥 量 。Rust 的 借用 系统 不 能 保护 你 避免 死 锁 。 最 好 的 保护 是 保持 
临界 区 最 小 化 : 进入 ， 干 活 儿 ， 退 出 。 


使 用 通道 也 有 可 能 导致 死 锁 。 例 如 ， 两 个 线程 可 能 相互 阻塞 ， 每 个 都 等 待 从 另 一 个 接收 消 
息 。 不 过 ， 良 好 的 程序 设计 可 以 让 你 高 度 自信 现实 中 不 会 发 生 这 种 情况 。 在 管道 中 ， 比 如 
我 们 的 倒 排 索引 构建 器 中 ， 数 据 流 是 非 循 环 的。 就 跟 在 Unix 管道 中 一 样 ， 在 这 样 的 程序 
里 不 可 能 发 生死 锁 。 


19.3.6 ”中 毒 的 互 斥 量 


Mutex: :Lock() 返回 一 个 Result， 原 因 与 JotnHandtLe: :join() 一 样 : 如 果 另 一 个 线程 证 异 
了 ， 则 可 以 优雅 地 收场 (失败 )。 在 写 handte.join().unwrap() 时 ， 我 们 是 在 告诉 Rust 把 
许 异 从 一 个 线程 传播 到 另 一 个 线程 。 常 用 的 mutex.Lock().unwrap() 也 一 样 。 


如 果 线 程 在 持 有 Mutex 时 许 异 了 ， 那 么 Rust 会 将 Mutex 标记 为 已 中 毒 。 后 续 想 要 锁 住 这 
受 污染 的 Mutex 的 尝试 都 会 得 到 一 个 错误 结果 。 我 们 的 .unwrap() 调用 告诉 Rust J 
况 下 要 许 异 ， 把 其 他 线程 的 许 异 传播 到 当前 线程 。 


如 果 出 现 了 中 毒 ， 那 互 斥 量 的 结果 有 多 糟糕 呢 ? 中 毒 听 起 来 很 中 人， 但 具体 情况 不 一 定 
是 致命 的 。 正 如 第 7 章 所 说 的 ， 许 异 是 安全 的 。 许 异 的 线程 保证 了 程序 其 余部 分 处 在 安全 
状态 。 


基于 许 异 毒化 互 斥 量 并 不 是 因为 害怕 未 定义 行为 ， 而 是 担心 你 有 可 能 正在 使 用 不 变性 编 
程 。 由 于 程序 府 异 了 ， 设 有 完成 应 该 做 的 事 就 脱离 了 临界 区 ， 因 此 可 能 已 经 更 新 了 受 保护 
数据 的 某 些 字段 ， 但 尚未 更 新 其 他 字段 。 为 此 ， 原 先 的 不 变性 可 能 已 经 遭 到 破坏 。Rust 通 
过 毒化 这 个 互 斥 量 来 防止 其 他 线程 在 不 经 意 间 也 出 现 这 种 局 面 ， 从 而 避免 把 问题 搞 得 更 精 
糕 。 在 完全 互 斥 的 情况 下 ， 还 是 可 以 锁 住 中 毒 的 互 斥 量 并 访问 其 中 数据 的 。 具 体 信 息 可 以 
参考 PoisonError::into_inner() 的 在 线 文 档 。 不 过 你 不 会 意外 做 到 这 一 点 的 。 


19.3.7 使 用 互 斥 量 的 多 消费 者 通道 


前 面 提 到 过 ，Rust 通道 是 多 生产 者 、 单 消费 者 的 。 或 者 更 具体 地 说 ， 一 个 通道 只 有 一 个 
Receiver。 任 何 线程 池 都 不 能 有 多 个 线程 使 用 一 个 mpsc ed 


不 过 ， 有 个 非常 简单 的 方式 可 以 绕 过 这 个 限制 ， 只 需要 使 用 标准 库 。 可 以 为 Recetver 添加 
一 个 mutex， 然 后 再 共享 。 下 面 是 一 个 实现 它 的 模块 ， 


pub mod shared_channel { 
use std::sync::{Arc, Mutex}; 
use std::sync::mpsc::{channel, Sender, Receiver}; 
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/// 对 Receiver 的 线程 安全 的 封装 
#[derive(Clone)] 
pub struct SharedReceiver<T>(Arc<Mutex<Receiver<T>>>); 
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impl<T> Iterator for SharedReceiver<T> { 
type Item = T; 


/// 从 封装 的 接收 者 获取 下 一 项 
fn next(&mut self) -> Option<T> { 
Let guard = seLf.0.Lock().unwrap(); 
guard.recv().ok() 
} 
/// 创建 一 个 新 通道 ， 其 接收 者 可 以 跨 线 程 共 享 。 这 会 返回 一 个 
/// 发 送 者 和 一 个 接收 者 ， 与 stdlib 的 channel() 类 似 ， 有 时 候 
/// 可 以 直接 代 禁 它 使 用 
pub fn shared_channeL<T>() -> (Sender<T>, SharedReceiver<T>) { 
Let (sender, receiver) = channel(); 
(sender, SharedReceiver(Arc::new(Mutex::new(receiver)))) 











} 
这 里 使 用 了 一 个 Arc<Mutex<Receiver<T>>>， 其 中 泛 型 被 认 套 了 很 多 层 。 这 种 情况 在 Rust 
中 比 在 C++ 中 更 常见 。 好 像 这 样 更 容易 让 人 迷惑 ， 但 通常 在 这 种 情况 下 ， 只 要 依次 读 出 它 
们 的 名 字 就 可 以 理解 其 含义 ， 如 图 19-11 所 示 。 


























分 配 在 堆 的 原子 级 引用 计数 的 
互 斥 量 保护 的 
值 ， 接 收 
茧 类 植物 邻 人 兴奋 的 更 新 





Arc<Mutex<Receiver<FernEvent>>> 











19-11: 衬 套 的 泛 型 


19.3.8 读 / 写 锁 (RwLock<T>) 


下 面 介绍 Rust 标准 库 工 具 箱 提 供 的 另 一 个 线程 同步 工具 : std::sync。 我 们 会 快速 介绍 ， 
因为 对 这 些 工 具 的 全 面 讨论 超出 了 本 书 范围 。 


服务 器 程序 经 常 有 一 些 配置 信息 ， 这 些 信 息 只 需 加 载 一 次 ， 之 后 很 少 会 改变 。 大 多 数 线程 
只 查询 这 个 配置 ， 但 由 于 配置 还 是 有 可 能 会 改变 〈 比 如 请 求 服 务 器 从 磁盘 重新 加 载 其 配 
置 )， 因 此 必须 通过 一 个 锁 来 保护 。 在 类 似 这 样 的 情况 下 ， 使 用 互 斥 量 是 可 以 的 ， 但 是 个 
不 必要 的 瓶 开 。 如 果 不 是 正在 被 修改 ,线程 就 不 应 该 排队 来 查询 配置 。 这 时 候 可 以 使 用 
读 / 写 锁 或 RwLock。 


互 斥 量 有 一 个 Lock 方法 ， 读 / 写 锁 则 有 两 个 : read 和 write， 其 中 ，RwLock: :write 方法 与 
Mutex: :Lock 类 似 ， 都 是 等 待 获取 对 受 保护 数据 的 专 有 mut 访问 。 而 RwLock: :read 方法 提 
供 了 非 mut 访问 ， 其 优点 是 不 太 可 能 需要 等 待 ， 因 为 多 个 线程 可 以 同时 安全 读 取 数 据 。 在 
使 用 互 斥 量 的 情况 下 ， 在 任意 给 定时 刻 ， 受 保护 数据 只 能 有 一 个 读 取 器 或 写 入 器 (或 者 两 
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者 都 没有 )。 在 使 用 读 / 写 锁 的 情况 下 ， 则 可 以 有 一 个 写 入 器 或 多 个 读 取 器 ， 这 看 起 来 非常 
像 Rust 的 引用 。 
FernEmpireApp 可 以 有 一 个 结构 体 保存 配置 信息 ， 由 一 个 RwLock 来 保护 : 

use std::sync::RwLock; 

struct FernEmpireApp { 

cohiftas RwLock<AppConfig>, 

i 
读 取 这 个 配置 的 方法 可 以 使 用 RwLock: :read(); 

/// 如 果 应 该 使 用 实验 性 真菌 代码 则 为 true 

fn mushrooms_enabled(&self) -> bool { 


Let config guard = self.config.read().unwrap(); 
config_guard.mushrooms_enabled 




















} 
重新 加 载 这 个 配置 的 方法 应 该 使 用 RwLock: :write(): 


fn reLoad_config(&seLf) -> io::Result<()> { 
Let new_config = AppConfig: :load()?; 
Let mut config guard = self.config.write().unwrap(); 
*config_guard = new_config; 
Ok(()) 
} 


当然 ，Rust 非常 到 位 地 对 RwLock 数据 施加 了 安全 限制 。 这 个 单 写 入 器 或 多 读 取 器 的 概念 
是 Rust 借用 系统 的 核心 。self.config.read() 返回 一 个 守卫 ， 可 以 提供 对 Appconfig 的 非 
mut ( 即 共享 ) 访问 ，self.config.write() 返回 一 个 不 同类 型 的 守卫 ， 可 以 提供 mut ( 即 专 
有 ) 访问 。 





19.3.9 条 件 变量 〈Condvar) 
一 个 线程 经 党 需要 等 待 某 个 条 件 变 为 true。 


。 在 服务 器 关机 期 间 ， 主 线程 可 能 需要 等 待 所 有 其 他 线程 完全 退出 。 
。 工作 线程 在 没什么 事 可 做 时 ， 需 要 等 待 要 处 理 的 数据 。 
。 实现 分 布 式 共识 协议 的 线程 可 能 需要 等 待 足够 多 对 等 线程 的 响应 。 


有 了 时候， 针对 某 个 需要 等 待 的 条 件 会 有 方便 的 阻塞 API， 比 如 对 服务 器 关机 的 例子 有 
JoinHandle::join。 但 有 时候 没 有 内 置 的 阻塞 API。 此 时 程序 可 以 使 用 条 件 变量 (condition 
variable) 来 构建 自己 的 API。 在 Rust 中 ，std: :sync: :Condvar 类 型 实现 了 条 件 变 量 。Condvar 
有 方法 .wait() 和 .notify_all()， 其 中 ，.wait() 可 以 阻塞 到 某 些 线程 调用 .notify_all()。 
不 过 问题 还 会 更 复杂 一 些 ， 因 为 条 件 变 量 始 终 代表 由 某 个 Mutex 保护 的 数据 或 真 或 假 的 条 
件 。 为 此 ，Mutex 和 Condvar 是 有 关系 的 。 由 于 篇 幅 所 限 ， 本 书 对 此 就 不 作 完 整 的 解释 了 。 
不 过 对 于 之 前 使 用 过 条 件 变 量 的 程序 员 ， 我 们 可 以 展示 两 段 关 键 代 码 。 
























































在 期 待 的 条 件 变 为 true 时 ， 调 用 Condvar::notify_all (或 notify_one) 以 唤醒 任何 等 待 
的 线程 : 


seLf .has_data_condvar .notify _all(); 


要 进入 休眠 并 等 待 基 个 条 件 变 为 true， 使 用 Condvar: :wait(): 


while !guard.has_data() { 
guard = self.has_data_condvar .wait(guard).unwrap(); 


} 
这 个 while 循环 是 等 待 条 件 变 量 的 标准 写法 。 不 过 ，Condvar: :wait 的 签名 非 同 寻常 ， 它 接 
收 MutexGuard 对 象 的 值 ， 然 后 消费 它 ， 再 在 成 功 时 返回 一 个 新 的 MutexGuard。 这 给 人 的 感 
觉 是 wait 方法 释放 了 互 斥 量 ， 然 后 在 返回 之 前 又 重新 获得 了 它 。 传 入 MutexGuard 的 值 相 
当 于 表明 :“.wait() 方法 ， 我 把 释放 互 斥 量 的 特权 授予 你 。 


19.3.10 ”原子 类 型 

std: :sync: :atomic 模块 包含 无 锁 并 发 编程 要 使 用 的 原子 类 型 。 这 些 类 型 基本 上 与 标准 C++ 
原子 类 型 相同 。 

。 AtomicIsize 和 AtomicUsize 是 共享 的 整数 类 型 ， 对 应 单线 程 的 isize 和 usize 类 型 。 

。 AtomicBool 是 一 个 共享 的 bool 值 。 

。 AtomicPtr<T> 是 不 安全 指针 类 型 *mut T 的 共享 值 。 

关于 如 何 正确 使 用 原子 数据 超出 了 本 书 范围 。 一 言 以 蔽 之 ， 就 是 多 线程 可 以 同时 读 取 原子 
值 但 不 会 导致 数据 争 用 。 

与 常规 算术 和 人 逻辑 操作 符 不 同 ， 原 子 类 型 暴露 了 执行 原子 操作 的 方法 ， 涉 及 个 别 值 的 加 
载 、 存 储 、 交 换 和 算术 操作 ， 作 为 一 个 单元 执行 ， 而 且 即 使 其 他 线程 也 对 同一 块 内 存 执行 
原子 操作 仍 能 保证 安 人 全。 比如， 下面 的 代码 会 递增 名 为 atom 的 AtomtcIsize: 


use std::sync::atomic::Ordering; 






































atom.fetch_add(1, Ordering::SeqCst); 


这 些 方法 可 以 编译 为 特殊 的 机 器 语言 指令 。 在 x86-64 架构 上 ，.fetch_add() 调用 编译 为 
Lock incq 指令 ， 其 中 普通 的 n += 1 可 以 编译 为 纯 incq 指令 或 相关 的 其 他 任何 变 体 。Rust 
编译 器 同样 必须 放弃 对 原子 操作 的 某 些 优 化 ， 因 为 (与 正常 加 载 、 存 储 不 同 ) 其 他 线程 可 
以 理所当然 地 立即 观察 到 。 


参数 ordering: :SeqCst 是 一 个 内 存 排序 (memory ordering)。 内 存 排序 类 似 于 数据 库 中 的 
一 个 事务 隔离 层 。 它 们 告诉 系统 相 比 于 性 能 ， 你 对 这 些 哲学 概念 〈 比 如 导致 前 面 的 效果 和 
没有 循环 的 时 间 ) 有 多 么 关注 。 内 存 排 序 对 程序 执行 是 否 正确 至 关 重 要 ， 但 也 非常 不 好 理 
解 和 推断 。 不 过 令 人 高 兴 的 是 ， 选 择 顺 序 一 致 性 〈 最 严格 的 内 存 排序 ) 的 性 能 损失 通常 很 
低 。 这 跟 把 SQL 数据 库 放 到 SERIALIZABLE 模式 下 的 性 能 损失 不 可 同日 而 语 。 因 此 如 果 不 
敢 肯 定 ， 那 就 用 ordering: :SeqCst。Rnust 从 标准 C++ 原子 类 型 继承 了 其 他 几 种 内 存 排 序 ， 
对 存在 和 时 间 也 有 不 同 程度 的 弱化 保证 。 这 里 就 不 讨论 它们 了 。 
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原子 的 一 假设 有 一 个 线程 正在 执行 某 个 耗 时 的 计算 任务 
如 演 染 视频 ， 而 我 们 希望 能 够 异步 取消 这 个 操作 。 问 题 在 于 如 何 与 希望 ee 
通信 。 可 以 通过 一 个 共享 的 AtomicBool 来 实现 : 


use std::sync::atomic::{AtomicBool, Ordering}; 








Let cancel_flag = Arc::new(AtomicBool: :new(false)); 
Let worker_cancel_flag = cancel_flag.clone(); 


以 上 代码 创建 了 两 个 Arc<AtomicBool> 智能 指针 ， 都 指向 分 配 在 堆 上 的 AtomicBool， 其 初 
始 值 是 fatse。 第 一 个 名 为 cancel_flag， 会 保留 在 主线 程 。 第 二 个 名 为 worker_cancel_ 
flag， 会 被 转移 到 工作 线程 。 


下 面 就 是 工作 线程 相关 的 代码 : 


Let worker_handle = spawn(move || { 
for pixel in animation.pixels mut() { 
render(pixel); // 光线 跟踪 ， 需 要 花 儿 微 秒 时 间 
if worker_cancel_flag.load(Ordering::SeqCst) { 
return None; 
} 
} 


Some(animation) 


}); 
演 染 完 每 个 像素 ， 线 程 都 会 调用 .Load() 方法 检查 取消 标志 的 值 : 
worker_cancel_flag.load(Ordering::SeqCst) 


如 采 主 线程 决定 取消 工作 线程 的 工作 ， 就 可 以 把 true 保存 到 AtomicBool， 然 后 等 着 线程 自 
己 退 出 : 


// 取消 演 染 


cancel_flag.store(true, Ordering::SeqCst); 





// 丢弃 结果 ， 有 可 能 是 None 
worker_handle.join().unwrap(); 


当然 ， 还 有 其 他 实现 方式 。 比 如 ， 可 以 用 Mutewsbeol> 或 通 刘 下 和 内 这 寺中 AonieBool, 
主要 区 别 在 于 原子 的 开销 最 小 。 原 子 操作 永远 不 使 用 系统 调用 。 加 载 和 存储 经 常 编 译 为 一 
个 CPU 指令 。 


原子 是 一 种 内 部 修改 能 力 ， 与 Mutex 或 RwLock 类 似 ， 因 此 它们 的 方法 也 以 self 的 共享 
( 非 mut) 引用 为 参数 。 而 这 也 让 它们 可 以 作为 简单 的 全 局 变量 来 使 用 。 


19.3.11 全 局 变量 
假设 我 们 正在 编写 网 络 代码 。 我 们 希望 有 一 个 全 局 变量 ， 一 个 计数 器 ， 每 次 发 送 一 个 数据 
包 都 给 它 递 增 一 次 : 


/// 服务 器 成 功 处 理 的 数据 包 数 
static PACKETS_SERVED: usize = 0; 

















这 可 以 编译 通过 。 不 过 有 个 问题 ; PACKETS_SERVED 是 不 可 修改 的 ， 因 此 无 法 修改 它 。 

Rust 尽 其 所 能 阻止 全 局 可 修改 状态 。 当 然 使 用 const 声明 的 常量 是 不 可 修改 的 。 静 态 变 量 
默认 同样 不 可 修改 ， 因 此 无 法 取得 某 个 值 的 mut 引用 。static 可 以 声明 为 mut， 但 再 访问 
它 就 是 不 安全 的 。Rust 的 这 些 规则 的 主要 目的 都 是 保证 线程 安全 。 

全 局 可 修改 状态 同样 会 带 来 严重 的 软件 工程 后 果 ， 比 如 造成 程序 不 同 部 分 更 紧密 耦合 ， 更 
难 测 试 ， 将 来 也 更 难 修改 。 同 样 ， 在 某 些 情 况 下 确实 没有 合理 的 替代 ， 因 此 最 好 能 找到 一 
种 安全 的 方式 来 声明 可 修改 的 静态 变量 。 

支持 递增 PACKETS_SERVED， 同 时 又 能 保证 线程 安全 的 最 简单 方式 ， 就 是 把 它 改 成 一 个 原子 
整数 : 


use std::sync::atomic::{AtomicUsize, ATOMIC_USIZE_INIT}; 


















































static PACKETS_SERVED: AtomicUsize = ATOMIC_USIZE_INIT; 


这 里 的 常量 ATOMIC_USIZE_INIT 是 一 个 值 为 0 的 Atomicusize。 之 所 以 使 用 这 个 常量 而 不 
是 表达 式 AtomicUsize::new(0)， 是 因为 静态 原子 变量 的 初始 值 必须 是 常量 。 到 Rust 1.17 
为 止 ， 还 不 允许 方法 调用 。 类 似 地 ，ATOMIC_ISIZE_INIT 是 一 个 值 为 0 的 AtomicIsize， 而 
ATOMIC_BOOL_INIT 是 一 个 值 为 false 的 AtomicBool。 
在 这 个 静态 被 声明 之 后 ， 递 增 包 计 数 器 就 很 简单 了 : 
PACKETS_SERVED.fetch_add(1, Ordering::SeqCst); 
原子 全 局 变量 只 能 是 简单 的 整数 或 布尔 值 。 不 过 ， 要 创建 其 他 任何 类 型 的 全 局 变量 也 都 需 
要 解决 两 个 问题 ， 都 很 容易 。 
。 变量 必须 通过 某 种 方式 保证 线程 安全 ， 因 为 要 不 然 就 不 能 是 全 局 变量 。 考 虑 到 安全 ， 静 
态 变 量 必须 既是 Sync 又 是 非 mut。 
幸运 的 是 ， 我 们 已 经 看 到 过 这 个 问题 的 解决 方案 了 。Rust 有 针对 安全 共享 可 变化 值 的 
类 型 : Mutext、RwLock 和 原子 类 型 。 这 些 类 型 即使 在 被 声明 为 非 mut 的 情况 下 也 是 可 以 
修改 的 。 这 就 是 它们 的 目的 所 在 。( 参 见 19.3.3 节 。) 
。 如 前 所 述 ， 静 态 初 始 化 器 不 能 调用 函数 。 这 意味 着 声明 静态 Mutex 的 显 式 方式 行 不 通 。 


static HOSTNAME: Mutex<String> = 
Mutex: :new(String::new()); // 错误 : 声明 静态 值 时 调用 函数 


可 以 使 用 Lazy_static 包 来 解决 这 个 问题 。 


17.5.2 节 介 绍 过 lazy_static 包 。 通 过 lazy_static! 宏 定 义 的 变量 可 以 使 用 任何 表达 式 来 
初始 化 。 这 个 表达 式 会 在 变量 第 一 次 被 解 引 用 时 运行 ， 而 值 会 保存 下 来 供 后 续 操 作 使 用 。 


可 以 像 下 面 这样 使 用 Lazy_static 来 声明 一 个 全 局 Mutex: 


#[macro_use] extern crate lazy_static; 
































use std::sync: :Mutex; 
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lazy_static! { 


static ref HOSTNAME: Mutex<String> = Mutex::new(String::new()); 


} 
同样 的 技术 也 可 以 用 于 RwLock 和 AtomicpPtr 变量 。 
使 用 lazy_static! 会 在 每 次 访问 静态 数据 时 造成 微小 的 性 能 损失 ， 





因为 其 实现 使 用 了 为 一 


次 性 初始 化 而 设计 的 一 个 低级 同步 原 语 std: :sync: :0nce。 在 后 台 ， 每 次 访问 懒 静态 数据 ， 








程序 都 要 执行 一 次 原子 加 载 指 令 以 检查 初始 化 是 否 完成 。(0nce 是 有 特殊 用 途 的 ， 这 里 不 





作 详 细 介绍 。 通 常 为 了 方便 起 见 还 是 应 该 使 用 lazy_static!。 不 过 在 初始 化 非 Rust 库 时 ， 


once 很 有 用 。 对 此 请 参见 21.8.5 节 的 例子 。) 


19.4 习惯 编写 Rust 并 发 代码 


本 章 介 绍 了 3 种 在 Rust 中 使 用 线程 的 技术 : 并 行 分 又 - 合并、 通道 和 基于 锁 共 享 可 修改 状 
态 。 本 章 的 目的 是 全 面 介 绍 Rust 为 此 提供 的 能 力 ， 并 以 贴近 实际 应 用 为 出 发 点 。 
Rust 坚持 线程 安全 ， 因 此 从 你 决定 编写 多 线程 程序 那 一 刻 开 始 ， 焦 点 就 是 构建 安全 、 结 构 
化 的 通信 。 保 持 线程 隔离 很 大 程度 上 可 以 让 Rust 相信 你 的 代码 是 安全 的 。 而 且 隔 离 也 是 保 
证 你 的 代码 正确 运行 和 容易 维护 的 基础 。 同 样 ，Rust 会 指导 你 写 出 优秀 的 程序 。 
更 重要 的 是 ，Rust 允许 你 同时 使 用 多 种 技术 ， 人 允许 实验 。 你 可 以 快速 欠 代 : 面 对 编 译 器 质 

















疑 而 不 断 改进 然后 上 线 要 比 调试 数据 争 用 的 效率 高 太 多 了 。 











集 向 (cento， 源 自 拉 丁 文 patchwork， 意 为 “拼凑 的 东西 ") 是 一 种 完全 从 另 一 个 
人 的 诗句 里 摘录 的 身子 拼 成 的 诗 。 





Matt Madden 
这 是 你 引用 的 名 言 。 





Bjarne Stroustrup 


Rust 支持 宏 。 宏 是 扩展 语言 的 一 种 方式 ， 可 以 实现 超越 函数 的 功能 。 例 如 ， 我 们 已 经 见 过 
的 assert_eq! 宏 ， 可 以 方便 地 用 于 测试 : 


assert_eq!(gcd(6, 10), 2); 


这 可 以 写成 一 个 泛 型 函数 ， 不 过 assert_eq! 宏 可 以 做 到 函数 做 不 到 的 几 件 事 。 一 件 事 是 在 
断言 失败 时 ，assert_eq! 宏 可 以 生成 包含 断言 文件 名 和 行 号 的 错误 消息 。 函 数 没 办 法 取得 
这 些 信息 。 宏 可 以 ， 因 为 它 的 工作 方式 与 函数 完全 不 同 。 


宏 是 某 种 简写 形式 。 在 编译 期 间 ， 在 检查 类 型 和 生成 任何 机 器 码 之 前 ， 每 个 宏 调 用 都 会 被 
扩展 (expanded)。 换 句 话说 ,每 个 宏 调 用 都 会 被 禁 换 成 其 他 一 些 Rust 代码 。 比 如 前 面 的 
宏 调 用 扩展 后 就 是 这 样 的 : 
match (&gcd(6, 10), &2) { 
(left val, right val) => { 
if !(*left val == *right val) { 
panic!("assertion failed: ‘(left == right)’, \ 
(left: ‘“{:?}., right: “{:?}°)", left_ val, right_val); 
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其 中 的 panic! 也 是 一 个 宏 ， 因 此 它 之 后 也 会 扩展 为 某 些 Rust 代码 。 这 些 代码 会 使 用 另外 
两 个 宏 ， 即 file!() 和 line!()。 在 包 中 所 有 的 宏 调 用 全 部 扩展 完毕 后 ，Rust 才 会 进入 下 
一 个 编译 阶段 。 
在 运行 时 ， 断 言 失 败 会 像 下 面 这 样 (而 且 会 表示 gcd() 函数 中 存在 bug， 因 为 2 是 正确 的 
返回 值 ) : 

thread 'main' panicked at 'assertion failed: ‘(left == right)., (left: “17 ， 

Fahte “2°. ged.ise7 
如 果 你 有 C++ 编程 经 验 ， 可 能 会 对 宏 有 一 些 坏 印 象 。Rust 宏 采 取 了 不 同 的 思路 ， 类 似 于 
Scheme 的 syntax-rules。 相 比 于 C++ 宏 ，Rust 宏 可 以 更 好 地 与 语言 的 其 他 组 件 整 合 ， 
此 不 容易 出 错 。 宏 调用 始终 都 会 以 一 个 感叹 号 来 标记 ， 因 此 很 容易 在 代码 中 发 现 它 们 ， 而 
有 旦 也 不 会 在 想 调 用 函数 时 意外 调用 宏 。Rust 宏 永 远 不 会 插入 不 匹配 的 方 括号 或 圆 括号 。 另 
外 ，Rust 宏 自 带 模式 匹配 ， 所 以 自 定义 可 维护 且 好 用 的 宏 也 很 容易 。 


本 章 将 通过 几 个 例子 展示 如 何 编写 宏 。 然 后 深入 剖析 一 下 安 的 工作 原理 ， 因 为 跟 很 多 Rust 
概念 很 像 ， 宏 也 需要 深入 理解 才能 用 好 。 最 后 ， 我 们 会 看 一 下 在 简单 的 模式 匹配 不 够 用 时 
怎么 办 。 


20.1 宏基 础 


图 20-1 展示 了 assert_eq! 宏 源 码 的 几 个 部 分 。 








模式 


macro_rules! assert eq { 














20-1: assert_eq! 宏 


macro_rules! 是 Rust 中 定义 宏 的 主要 方式 。 注 意 在 宏 定义 中 ，assert_eq 后 面 没 有 感叹 
号 !。 只 有 调用 宏 的 时 候 才 需要 包含 感叹 号 !， 定 义 的 时 候 则 不 需要 。 
并 非 所 有 的 宏 都 是 以 这 种 方式 定义 的 。 有 儿 个 宏 ， 比 如 file!、line! 和 macro_rules!, 本 


身 是 内 置 在 编译 器 中 的 。 本 章 在 最 后 还 会 介绍 另 一 种 方式 ， 叫 过 程 宏 (procedural macro ) 。 
但 我 们 会 主要 讨论 macro_rules!, 这 是 (目前 ) 编写 自 定 义 宏 的 最 简单 方式 。 
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使 用 macro_rules! 定义 的 宏 完 全 基于 模式 匹配 实现 逻辑 。 宏 的 主体 就 是 一 系列 规则 : 


( 模式 1 ) =>( 模板 1 ); 
( 模式 2 ) =>( 模板 2 ); 


图 20-1 所 示 的 assert_eq! 宏 只 包含 一 个 模式 和 一 个 模板 。 


顺便 说 一 下 ， 模 式 和 模板 周围 也 可 以 不 用 圆 括 号 ， 而 用 方 插 号 或 花 括 号 。 对 Rust 来 说 ,使 
用 哪 种 括号 没有 区 别 。 类 似 地 ， 在 调用 宏 时 ， 以 下 形式 也 是 等 价 的 : 

assert_eq!(gcd(6, 10), 2); 

assert_eq![gcd(6, 10), 2]; 

assert_eq!{gcd(6, 10), 2} 
唯一 的 区 别 是 在 使 用 花 括 号 时 ， 最 后 的 分 号 是 可 选 的。 按照 惯例 ， 在 调用 assert_eq! 时 使 
用 圆 括号 ， 在 调用 vec! 时 使 用 方 括号 ， 而 在 调用 macro_rules! 时 使 用 花 括号 。 不 过 这 些 
都 只 是 约定 而 已 。 


20.1.1 宏 扩 展 基础 

Rust 会 在 编译 的 早期 扩展 宏 。 编 译 器 会 从 头 到 尾 读 取 你 的 源 代码 ， 同 时 定义 并 扩展 遇 到 的 
宏 。 不 能 在 定义 宏 之 前 调用 宏 ， 因 为 Rust 对 每 个 宏 调 用 是 边 分 析 边 扩展 的 。( 相 对 而 言 ， 
函数 及 其 他 特性 项 则 不 必 在 意 顺 序 。 比 如 可 以 先 调 用 一 个 函数 ， 然 后 再 在 后 面 通过 导入 包 
给 出 定义 。) 

Rust 在 扩展 assert_eq! 宏 调 用 时 ， 过 程 非常 类 似 求 值 match 表达 式 。Rust 首先 用 参数 去 匹 
配 模式 ， 如 图 20-2 所 示 。 



























































图 20-2; 扩展 宏 的 第 一 部 分 ， 对 参数 进行 模式 匹配 


宏 模 式 是 Rust 中 的 一 个 迷你 语言 。 它 们 本 质 上 是 用 于 匹配 代码 的 正则 表达 式 。 只 不 过 正则 
表达 式 操作 的 是 字符， 而 宏 模 式 操作 的 是 记号 (token)， 比 如 数字 、 名 称 、 标 点 等 Rust 程 
序 的 语法 符号 。 这 意味 着 在 宏 模 式 中 可 以 随意 使 用 注释 和 空白 ,以便 让 模式 更 容易 理解 。 
注释 和 空白 不 是 记号 ， 因 此 不 影响 匹配 。 

正则 表达 式 与 安 模式 的 另 一 个 重要 区 别 是 圆 括 号 、 方 括号 和 花 括 号 在 Rust 中 始终 都 是 成 对 
出 现 的 。Rust 在 扩展 宏 之 前 会 先 检查 这 个 规则 ， 且 不 限于 宏 模 式 ， 而 是 会 检查 这 门 语言 的 
所 有 代码 。 

在 这 个 例子 中 ， 我 们 的 模式 包含 $left:expr， 它 会 告诉 Rust 匹配 一 个 表达 式 (在 这 里 就 是 
gcd(6，10)) 并 将 其 赋值 给 $left。 然 后 Rust 会 匹配 模式 中 的 逗号 与 gcd 参数 后 面 的 逗号 。 跟 
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正则 表达 式 一 样 ， 宏 模式 中 只 有 少数 特殊 字符 会 触发 特殊 的 匹配 行为 ， 其 他 字符 ， 比 如 逗号 ， 
则 需要 按 字 面 匹配 ， 否 则 匹配 就 会 失败 。 最 后 ，Rust 匹配 表达 式 2 并 将 其 赋值 给 $right。 


这 个 模式 匹配 的 两 段 代码 都 是 expr 类 型 ， 意 味 着 它们 期 待 表达 式 。20.4.1 方 将 介绍 其 他 代 
码 片 段 类 型 。 


由 于 这 个 模式 匹配 了 全 部 参数 ， 因 此 Rust 会 扩展 对 应 的 模板 ， 如 图 20-3 所 示 。 


替换 为 gcd(6，10) 
p 替换 为 2 
match 枯 本 { 


(left_val, right_val) => { 
if !(*left_val == x*right_val) { 
panic!("assertion failed: ‘(left == right). \ 
(left: “{:7?}°, right: ~{:?}°)", 
left_val, right_val) 



































} 











图 20-3; 扩展 宏 的 第 二 部 分 : 填充 模板 


Rust 会 将 $left 和 $right 替换 为 它 在 匹配 期 间 找到 的 代码 片段 。 


在 输出 模板 中 包含 片段 类 型 是 一 个 常见 的 错误 ， 比 如 在 这 里 不 写 $left 而 是 写 $left:expr。 
Rust 不 会 立即 检测 这 种 错误 。 此 时 ， 它 会 将 $left 看 成 一 个 株 代 结果 ， 然 后 将 :expr 当 作 
模板 中 的 其 他 内 容 ( 即 宏 输出 中 包含 的 记号 ) 看 待 。 因 此 这 些 错误 在 实际 调用 宏 之 前 不 
会 发 生 ， 而 是 会 生成 无 法 编译 的 无 效 输出 。 如 末 在 使 用 新 宏 后 看 到 类 似 expected type， 
found “: 这 样 的 错误 消息 ， 那 可 以 查 一 下 是 不 是 存在 这 种 错误 。(20.3 节 对 类 似 这 种 情况 
给 出 了 更 通用 的 建议 。) 

宏 模 板 与 Web 编程 中 可 以 使 用 的 任何 模板 语言 没有 太 大 区 别 。 唯 一 的 区 别 ， 也 是 最 重要 的 
一 个 区 别 ， 就 是 宏 模 板 输出 的 是 Rust 代码 。 


20.1.2 ”意外 结果 


把 代码 片段 插入 模板 中 与 插入 使 用 值 的 常规 代码 中 有 一 些微 妙 的 差异 。 这 些 差异 一 开始 并 
不 十 分 明显 。 我 们 看 到 的 assert_eq! 宏 的 模式 中 包含 一 些 奇怪 的 代码 ， 那 是 因为 这 些 代码 
是 宏 编 程 代码 。 下 面 来 看 两 个 特别 奇怪 的 地 方 。 
首先 ， 为 什么 这 个 宏 会 创建 变量 left_val 和 right_val ? 难道 把 模板 简化 为 下 首 
什么 问题 吗 ? 

if !(SLeft == Sright) { 


panic!("assertion failed: ‘(left == right). \ 
(left: ‘{:7?}., right: “{:?}.)", $left, S$right) 
































这样 会 有 
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要 回答 这 个 问题 ， 可 以 在 头脑 中 想象 一 下 扩展 宕 调用 assert_eq!(Letters.pop()， 
Some('z'))。 输 出 会 是 什么 呢 ? 自然 地 ，Rust 会 把 匹配 的 表达 式 揪 入 模板 中 的 多 个 地 方 。 
而 在 构建 错误 消息 时 ， 再 把 表达 式 全 部 求 一 遍 值 似乎 是 没 必 要 的 。 不 仅 因为 要 多 花 一 倍 
时 间 ， 而 且 第 二 次 求 值 时 Letters.pop() 会 再 从 向 量 中 移 除 一 个 值 ， 从 而 导致 生成 不 同 的 
值 ! 这 就 是 真实 的 宏 只 会 计算 $left 和 $right 一 次 ， 并 存储 它们 的 值 的 原因 。 


再 看 第 二 个 问题 ,为 什么 这 个 宏 要 借用 $left 和 Sright 值 的 引用 ? 为 什么 不 像 下 面 这 样 把 
它们 存储 在 变量 中 ? 


macro_rules! bad_assert_eq { 
($left:expr, S$right:expr) => ({ 
match ($left, $right) { 
(left val, right val) => { 
if !(left val == right val) { 
panic!("assertion failed" /* ... */); 




















} 


}); 
} 


对 于 眼前 的 这 个 例子 来 讲 ， 宏 的 参数 是 整数 ， 这 样 没 问题 。 但 如 果 调 用 者 给 $left 或 
$right 传人 了 一 个 String 变量 ， 那 上 面 的 代码 就 会 把 值 从 变量 中 转移 出 来 ! 


fn main() { 
let s = "a rose".to_string(); 
bad_assert eq!(s, "a rose"); 


printLn!("confirmed: {} is a rose"，s); // 错误 : 使 用 转移 的 值 “s” 





因为 不 想 让 断言 转移 值 ， 所 以 宏 定 义 中 就 要 借用 其 引用 。 

(你 可 能 想 知道 ， 为 什么 这 个 宏 使 用 match 而 不 是 tet 定义 变量 。 我 们 也 很 纳 问 。 好 像 这 样 
做 并 没有 什么 特殊 的 原因 。 使 用 tet 结果 应 该 是 一 样 的 。) 

简 言 之 ， 宏 可 能 导致 意外 结果 。 如 果 你 写 的 宏 会 导致 奇怪 的 事件 发 生 ， 那 就 得 好 好 追究 一 
下 这 个 宏 的 责任 了 。 

你 不 会 看 到 下 面 这 个 经 典 的 C++ 宏 bug: 


// 给 某 个 数值 加 1 的 C++ 宏 ， 有 bug 

#define ADD_ONE(n) n + 1 
因为 大 多 数 C++ 程序 员 对 此 很 熟悉 ， 所 以 没 必 要 在 这 里 详细 解释 。 只 是 告诉 大 家 在 C++ 
中 ， 像 ADD_ONE(1) * 10 或 ADD_ONE(1 << 4) 这 样 并 不 起 眼 的 宏 调 用 代码 可 能 导致 令 人 震惊 
的 结果 。 要 修复 这 个 问题 ， 需 要 在 宏 定 义 中 多 加 一 层 圆 括号 。 这 在 Rust 中 不 是 必要 的 ， 因 
为 Rust 宏 跟 语言 集成 得 更 流畅 。Rust 知道 自己 什么 时 候 在 处 理 表 达 式 ， 因 此 会 在 把 一 个 
表达 式 粘 贴 到 另 一 个 表达 式 中 时 加 上 圆 括号 。 


20.1.3 ”重复 
标准 的 vec! 宏 有 两 种 形式 : 






























































// 重复 一 个 值 N 次 
Let buffer = vec![0_u8; 1000]; 


// 一 个 由 逗号 分 隔 的 值 列 表 
Let numbers = vec!["udon", "ramen", "soba"]; 
可 以 这 样 来 实现 它 ; 
macro_rules! vec { 
($elem:expr ; $n:expr) => { 
::std::vec::from elem($elem, $n) 
}3 
( $( $x:expr ),* ) => { 
<[_]>::into_vec(Box::new([ $( $x ),* ])) 
}s 
( $( $x:expr ),+ ,) => { 
veel[l $C $x 为 * 


曙 


} 
这 里 定义 了 3 条 规则 。 我 们 先 来 解释 多 条 规则 的 工作 方式 ， 然 后 再 逐一 看 每 条 规则 。 


Rust 在 扩展 类 似 vec![1，2，3] 这 样 的 宏 调 用 时 ， 首 先 会 用 参数 1，2，3 去 匹配 第 一 条 规 
则 ， 也 就 是 Selem:expr ; $n:expr。 这 次 匹配 会 失败 : 1 是 表达 式 ， 但 模式 要 求 接 下 来 是 
一 个 分 号 ， 可 参数 里 没有 。 因 此 Rust 会 转移 到 第 二 条 规则 ， 以 此 类 推 。 如 果 没 有 规则 匹 
配 ， 就 是 一 个 错误 。 

第 一 条 规则 处 理 类 似 vec![6u8; 1999] 这 样 的 用 法 。 恰 好 有 一 个 标准 的 国 数 满足 要 求 ， 即 
std::vec::from_eLem， 因 此 这 条 规则 的 模板 很 好 理解 。 

第 二 条 规则 处 理 vec!["udon"，"ramen",，"soba"] 这 样 的 调用 。 模 式 $( $x:expr ),* 使 用 了 之 
前 没有 见 过 的 一 个 特性 : 重复 。 它 匹配 0 或 多 个 表达 式 ， 以 逗号 分 隔 。 更 概括 地 说 ， 就 是 语 
法 $( PATTERN ),* 用 于 匹配 任何 以 有 逗号 分 隔 的 列表 ， 其 中 列表 的 每 一 项 都 匹配 PATTERN。 

这 里 的 * 与 其 在 正则 表达 式 中 的 含义 相同 (表示 “匹配 0 次 或 多 次 ”)， 当 然 正 则 表达 式 中 
是 没有 ,* 这 种 表示 重复 的 特殊 语法 的 。 在 这 里 也 可 以 使 用 + 表示 至 少 匹 配 一 次 。 不 过 没 
有 ?语法 。 表 20-1 总 结 了 所 有 的 重复 模式 表示 法 。 

表 20-1: 重复 的 模式 














































































































模 式 含义 

SC)* 匹配 0 或 多 次 ， 没 有 分 陋 符 

$C .oo ),* 匹配 0 或 多 次 ， 以 逗号 分 隔 

$C .oo );* 匹配 0 或 多 次 ， 以 分 号 分 隔 

SC …，)+ 匹配 1 或 多 次 ， 没 有 分 隔 符 

SC ，) ,+ 匹配 1 或 多 次 ， 以 逗号 分 隔 

SC );+ 匹配 1 或 多 次 ， 以 分 号 分 隔 

码 片 段 $x 不 只 是 一 个 表达 式 ， 而 是 一 组 表达 式 。 针 对 这 条 规则 的 模板 也 使 用 了 重复 语法 : 


<[_]>: :into_vec(Box::new([ $( $x ),* ])) 
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同样 ， 这 种 情况 也 有 标准 方法 可 以 实现 我 们 想 要 的 。 以 上 代码 创建 了 一 个 装 箱 数组 ， 然 后 
使 用 [T]: :into_vec 方法 将 装 箱 数组 转换 为 了 向 量 。 
开头 的 <[_]> 表示 “ 某 种 类 型 值 的 切片 "， 但 并 没有 明确 的 类 型 ， 而 是 希望 Rust 推断 元 素 
类 型 。 Pr ay fn()、&str 或 
[_] 等 类 型 则 必须 包装 在 一 对 尖 括 号 中 。 
重复 出 现在 这 个 模板 的 最 后 ， 也 就 是 $($x),* 这 部 分 。 这 跟 $( ... ),* 模式 的 语法 相同 ， 
表示 迭代 由 $x 匹配 的 一 组 表达 式 ， 并 将 它们 全 部 插入 模板 中 ， 以 逗号 分 隔 。 
在 这 里 ， 重 复 的 输出 看 起 来 跟 输入 一 样 。 不 过 ， 也 不 一 定 非 要 如 此 。 比 如 ， 也 可 以 这 样 
实现 : 
( $( $x:expr ),* ) => { 
{ 











Let mut Vv = Vec::new(); 
SC v.push($x); )* 
V 


} 
$( v.push($x); )* 对 $x 中 的 每 个 表达 式 都 插入 了 一 次 对 v.push() 的 调用 。 
与 Rust 的 其 他 特性 不 同 ， 使 用 $( ... ),* 的 模式 不 会 自动 支持 末尾 的 人 逗 号 可 选 。 不 过 ， 
对 此 我 们 有 一 个 标准 的 解决 方案 ， 即 通过 再 添加 一 条 规则 来 支持 末尾 的 有 逗号 。 这 就 是 vec! 
宏 的 第 三 条 规则 的 用 途 


( $( $x:expr ),+ ,) => { // 如 果 末 尾 存 在 辟 号 ， 去 掉 它 再 重 试 
vec![ $( $x ),* ] 
ss 


这 里 使 用 $( . , 来 匹配 带 有 额外 逗号 的 列表 。 然 后 在 模板 中 ， 再 递归 调用 vec!， 把 
逗号 去 掉 。 0 


ly 
20.2 ”内置 宏 
Rust 编译 器 提供 了 儿 个 内 置 的 宏 ， 以 辅助 我 们 编写 自 定 义 的 宏 。 这 些 宏 都 不 能 仅 任 使 用 
macro_rules! 来 实现 。 它 们 是 硬 编码 在 rustc 中 的 。 
。 file!() 扩展 为 一 个 字符 串 字 面 量 ， 即 当前 文件 名 。Line!() 和 coLumn!() 扩展 为 一 个 
u32 字面 量 ， 代 表 当 前 行 (从 1 开始 ) 和 列 (从 0 开始 )。 
如 果 一 个 宏 调 用 了 另 一 个 宏 ， 另 一 个 宏 又 调用 了 其 他 宏 ， 而 且 它 们 都 在 不 同 的 文件 
中 ， 那 么 最 后 一 次 对 file!()、line!() 或 column!() 的 调用 会 扩展 为 表示 第 一 次 宏 调 
用 的 位 置 。 
stringify!(...tokens...) 扩展 为 一 个 字符 串 字面 量 ， 包 含 给 定 的 记号 。assert! 宏 使 
用 这 个 内 置 宏 生 成 包含 断言 代码 的 错误 消息 。 
参数 中 的 宏 调 用 不 会 扩展 ， 即 stringify!(line!()) 会 扩展 为 字符 串 "line!()"。 












































Rust 从 记号 开始 构建 这 个 字符 串 ， 因 此 字符 串 中 不 包含 换行 或 广 释 。 

concat!(str0，str1，..….) 扩展 为 一 个 字符 串 字 面 量 ， 是 拼接 其 参数 之 后 的 结果 。 
Rust 还 定义 了 以 下 查询 构建 环境 的 宏 。 

cfg!(《...) 扩展 为 一 个 布尔 值 常量 ， 如 果 当 前 构建 配置 与 括号 中 的 条 件 匹 配 则 为 true。 
例如 ，cfg!(debug_assertions) 在 编译 时 启用 调试 断言 的 条 件 下 为 true。 

这 个 宏 支 持 与 8.5 市 介绍 的 \#[cfg(...)] 属性 相同 的 语法 ， 但 它 不 是 条 件 编译 ， 而 是 返 
回 true 或 faLse。 
。 env!("VAR_NAME") 扩展 为 一 个 字符 串 ， 即 指定 环境 变量 在 编译 时 的 值 。 如 果 指 定 的 变量 

不 存在 ， 就 是 一 个 编译 错误 。 

除非 Cargo 在 编译 一 个 包 时 设置 了 有 意思 的 环境 变量 ， 否 则 这 个 宏 没 什么 用 。 例 如 ， 要 

取得 包 的 当前 版 本 字符 串 ， 可 以 这 样 写 : 

Let version = env!("CARGO_PKG_VERSION"); 

关于 所 有 这 些 环境 变量 的 详细 信息 ， 请 参考 Cargo 的 文档 。 

。 option_env!("VAR_NAME") 与 env! 相同 ， 只 不 过 其 返回 0ption<&'static str>， 如 果 指 

定 变量 没有 设置 ， 则 返回 None。 

以 下 3 个 内 置 的 套 支持 从 另 一 个 文件 取得 代码 或 数据 。 

。 include!("file.rs") 扩展 为 指定 文件 的 内 容 ， 必 须 是 有 效 的 Rust 代码 ， 比 如 表达 式 或 
特性 项 的 序列 。 

。 incLude_str!("fiLe.txt") 扩展 为 一 个 &'static str， 包 含 指定 文件 的 文本 。 可 以 像 下 

面 这 样 使 用 它 。 


const COMPOSITOR_SHADER: &str = 
include_str!("../resources/compositor.glsl"); 


如 果 指 定 的 文件 不 存在 ， 或 者 文本 不 是 有 效 UTF-8， 就 会 导致 编译 错误 。 
。 include_bytes!("file.dat") 也 一 样 ， 只 不 过 是 将 文件 作为 二 进 制 数据 而 非 UTF-8 文本 
来 对 待 。 结 果 是 & static [u8]。 
与 所 有 安 一样 ， 这 些 内 置 的 安 都 是 在 编译 时 被 处 理 的 。 如 果 文 件 不 存在 或 者 不 能 读 ， 那 编 
译 就 会 失败 。 所 有 宏 都 不 能 在 运行 时 失败 。 在 任何 情况 下 ， 如 果 文 件 名 是 相对 路 径 ， 都 会 
相对 于 包含 当前 文件 的 目录 来 解析 。 


20.3 调试 宏 
调试 任性 的 宏 会 很 有 挑战 性 。 最 大 的 问题 是 宏 扩 展 的 过 程 是 不 可 见 的 。Rust 经 常会 扩展 所 
有 宏 ， 在 发 现 某 些 错 误 时 打印 出 一 条 错误 消息 ， 但 不 会 显示 包含 错误 的 完全 扩展 后 的 代码 。 


下 面 介绍 3 个 有 助 于 排除 宏 错误 的 工具 。( 这 些 特性 全 部 是 不 稳定 的 ， 但 因为 它们 实际 上 
只 用 于 开发 阶段 ， 而 不 是 要 提交 的 代码 中 ， 所 以 实践 中 并 不 是 什么 大 问题 。) 
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第 一 个 ， 也 是 最 简单 的 ， 可 以 使 用 rustc 展示 代码 在 扩展 所 有 安之 后 的 样子 。 使 用 cargo 
build --verbose 可 以 看 到 Cargo 是 如 何 调用 rustc 的 。 复 制 rustc 命令 行 ， 然 后 加 上 -z 
unstable-options --pretty expanded 选项 。 完 全 扩展 后 的 代码 会 显示 在 终端 上 上。 可惜 的 
是 ， 只 有 在 你 的 代码 没有 语法 错误 时 ， 这 种 方式 才 可 以 使 用 。 

第 二 个 ，Rust 提供 了 一 个 log_syntax!() 宏 ， 其 可 以 在 编译 时 把 它 的 参数 打印 到 终端 上 。 
可 以 使 用 它 实现 类 似 println! 的 调试 。 这 个 宏 要 求 #![feature(log_syntax)] 特性 标志 。 


第 三 个 ， 可 以 让 Rust 编译 器 把 所 有 宏 调 用 的 日 志 打 印 到 终端 上 。 在 你 代码 的 某 个 地 方 插入 
trace_macros!(true);。 然 后 ，Rust 每 扩展 一 个 宏 ， 都 会 打印 宏 的 名 字 和 参数 。 例 如 ， 以 
下 程序 : 


#![feature(trace_macros)] 








fn main() { 
trace_macros!(true); 
Let numbers = vec![1, 2, 3]; 
trace_macros!(false); 
println!("total: {}", numbers.iter().sum::<y64>()); 


} 
会 输出 以 下 结果 : 


$ rustup override set nightly 





$ rustc trace_example.rs 
note: trace_macro 
--> trace_example.rs:5:19 


5 Let numbers = vec![1, 2, 3]; 


| 
| 
| 八 八 八 八 八 八 八 八 八 八 八 八 八 
| 


note: expanding ‘vec! {1，2 ,3}. 
note: to ‘<[_]>:: intovec( box[1,2,3]). 


编译 器 会 显示 每 次 宏 调 用 的 代码 ， 既 包括 扩展 前 的 也 包括 扩展 后 的 。 而 trace_macros!(false); 
又 关闭 了 宏 追 踪 ， 因 此 就 不 会 追踪 对 println!() 的 调用 了 。 





20.4 json! 宏 


前 面 已 经 讨论 了 macro_rules! 的 核心 特性 。 接 下 来 ， 本 市 会 循序 渐进 地 开发 一 个 构建 
JSON 数据 的 宏 。 通 过 这 个 例子 ， 可 以 了 解 怎么 开发 安 ， 同 时 本 节 也 介绍 了 macro_rules! 
剩 下 的 几 个 特性 。 此 外 ， 我 们 也 会 对 如 何 确保 你 的 宏 如 期 运转 给 出 一 些 建议 。 


第 10 章 曾 经 展示 过 一 个 用 枚 举 表示 的 JSON 数据 : 


#[derive(Clone, PartialEq, Debug)] 
enum Json { 

Null, 

Boolean(bool), 

Number (f64), 























String(String), 

Array(Vec<Json>), 

Object(Box<HashMap<String, Json>>) 
} 


可 是 用 来 创建 这 个 Json 值 的 代码 显得 非常 哆 唆 : 


Let students = Json::Array(vec![ 
Json: :Object(Box: :new(vec![ 

"name".to_string(), Json::String("Jim Blandy".to_string())), 
("class_of".to_string(), Json::Number(1926.0)), 
("major".to_string(), Json::String("Tibetan throat singing".to_string())) 

].into iter().collect())), 
Json: :0bject(Box: :new(vec![ 

"name".to_string(), Json::String("Jason Orendorff".to_string())), 
("class_of".to_string(), Json::Number(1702.0)), 
("major".to_string(), Json::String("Knots".to_string())) 

].into iter().collect())) 
]); 


我 们 希望 可 以 使 用 像 下 面 这 样 JSON 风格 的 语法 : 


Let students = json!([ 





{ 
"name": "Jim Blandy", 
"class_of": 1926, 
"major": "Tibetan throat singing" 
}, 
{ 
"name": "Jason Orendorff", 
"class_of": 1702， 
"major": "Knots" 
} 


]); 


其 实 就 是 需要 开发 一 个 json! 宏 ， 它 接收 一 个 JSON 值 作为 参数 ， 然 后 将 其 扩展 为 类 似 前 
面 代码 中 的 Rust 表达 式 。 


20.4.1 片段 类 型 

要 开发 一 个 复杂 的 宏 ， 第 一 项 工作 是 规划 好 如 何 匹 配 (解析 ) 期 望 的 输入 。 

我 们 已 经 知道 这 个 宏 应 该 包含 多 条 规则 ， 因 为 JSON 数据 可 以 包含 多 种 数据 类 型 ， 如 对 象 、 
数组 、 数 值 ， 等 等 。 事实 上 ， 可 以 假设 对 每 种 JSON 类 型 都 写 一 条 规则 : 


macro_rules! json { 
(null) => { Json::NULL }; 














CE ka | Es J ArayG ee) Fs 

Ct nin 4) > JSon:0bDjeet(, sy) Fs 
(???) => { Json::Boolean(...) }; 
(???) => { Json::Number(...) }; 
(772) => { Json::String(...) }; 
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这 样 肯定 不 行 ， 因 为 安 模式 并 没有 提供 表达 最 后 3 种 形式 的 方式 ， 稍 后 我 们 会 再 讨论 。 先 
来 看 前 3 种 情况 ， 至 少 它们 有 差异 明显 的 记号 ， 所 以 先 从 它们 入 手 。 
第 一 条 规则 这 样 写 就 可 以 了 : 


macro_rules! json { 





(null) => { 
Json::Null 
} 
} 
#[test] 


fn json_null() { 
assert_eq!(json!(nuLL)，Json::NULL); // 通过 | 
} 


要 支持 JSON 数组 ， 可 以 尝试 用 expr 来 匹配 元 素 : 
macro_rules! json { 


(null) => { 
Json::Null 

















}; 
([ $( $element:expr ),* ]) =>{ 
Json::Array(vec![ $( $element ),* ]) 

















}; 
} 
可 惜 这 样 并 不 能 匹配 所 有 JSON 数组 。 下 面 的 测试 说 明了 问题 : 
#[test] 


fn json_array_with_ json element() { 
let macro_generated value = json!( 
[ 
// 有 效 的 JSON， 但 不 匹配 $element:expr 
{ 


"pitch": 440.0 


] 
3 
let hand_coded value = 
Json::Array(vec![ 
Json: :Object(Box: :new(vec![ 
("pitch".to_string(), Json::Number(440.0)) 
].into iter().collect())) 
]); 
assert_eq!(macro_generated_ value, hand_coded value); 


} 


模式 . $( $element:expr ),* 的 意思 是 “逗号 分 隔 的 Rust 表达 式 的 列表 ”。 但 很 多 JSON 值 ， 
特别 是 对 象 ， 并 不 是 有 效 的 Rust 表达 式 。 所 以 不 会 匹配 。 

因为 我 们 想 要 匹配 的 代码 并 非 都 是 表达 式 ， 所 以 Rust 还 支持 了 其 他 一 些 片 段 类 型 ， 如 表 
20-2 所 示 。 




















表 20-2: macro_rules! 宏 支持 的 片段 类 型 





























片段 类 型 匹配 ( 示例 ) 后 面 可 以 跟 …… 

Expr 表达 式 : => ,3 
2 + 2, "udon", x.len() 

stmt 表达 式 或 声明 ， 不 包含 末尾 的 分 号 => ，; 
(很 难 用 ， 优 先 使 用 expr 或 block) 

ty 类 型 ; =>，;=|{[:> 
String、Vec<u8>、(&str, bool) as where 

path 路 径 (8.2.2 节 讨 论 过 ) : =>>,，;=|1{[:> 
ferns、 ::std::sync::mpsc as where 

pat 模式 (10.2 节 讨 论 过 ) : => ,= | if in 
_、Some(ref x) 

item 寺 性 项 (6.3 节 讨 论 过 ) : 不 限 
struct Point { x: f64, y: f64}、 mod ferns; 

block 代码 块 (6.2 节 讨 论 过 ) : 不 限 
{s+= "ok\n"; true } 

meta 属性 体 (8.5 节 讨 论 过 ) : 不 限 
inline、 derive(Copy, Clone)、 doc="3D models." 

ident 标识 符 : 不 限 
std、Json、Longish_variabLe_name 

tt 记号 树 (参见 正文 ) : 不 限 





;、>=、{}、 [9 1 (+ 9 1)] 


表 中 所 列 的 大 多 数 选项 严格 对 应 Rust 语法 。 比 如 ，expr 类 型 只 匹配 Rust 表达 式 (而 非 JSON 
值 )，ty 匹配 Rust 类 型 ， 等 等 。 这 些 选 项 都 不 能 扩展 ， 也 就 是 说 没有 办 法 定义 可 以 让 expr 认 
可 的 新 的 算术 操作 符 或 新 关键 字 。 我 们 也 不 能 使 用 其 中 任何 一 项 来 匹配 任意 JSON 数据 。 


最 后 两 个 片段 类 型 ， 即 ident 和 tt， 支持 匹配 看 起 来 不 是 Rust 代码 的 宏 参 数 ， 其 中 ident 
匹配 任意 标识 符 ，tt 匹配 一 个 记号 树 (token tree)。 所 谓 记号 树 ， 可 以 是 一 个 配对 正确 的 
括号 ， 如 (...)、[.…….] 或 {...}， 以 及 括号 中 的 任何 东西 ， 包 括 在 套 的 记号 树 ， 也 可 以 是 
一 个 单独 的 非 括号 记号 ， 如 1926 或 "Knots"。 


记号 树 正 是 实现 json! 宏 所 需要 的 。 每 个 JSON 值 都 是 一 个 记号 树 ， 比 如 数值 、 字 符 串 、 
布尔 值 ， 以 及 null 都 是 单独 的 记号 ， 对 象 和 数组 则 是 有 括号 的 记号 。 因 此 ， 可 以 把 模式 改 
写成 下 面 这 样 ， 
macro_rules! json { 
(null) => { 
Json::Null 
}; 
([ $( seLement:tt ),* ]) => { 
Json::Array(...) 
}; 
({ $( $key:tt : SvaLue:tt ),* }) => { 
Json: :0bject(...) 
}; 
(Sother :tt) => { 
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..。 // T0D0: 返回 Number、String 或 BooLean 





} 
} 

这 个 版 本 的 json! 宏 可 以 匹配 所 有 JSON 数据 。 接 下 来 只 要 生成 正确 的 Rust 代码 即 可 。 

为 确保 将 来 无 论 增加 什么 语法 特性 都 不 会 破坏 你 今天 写 的 宏 ，Rust 对 模式 中 可 以 跟 在 片 
段 后 面 的 记号 做 了 限制 。 表 20-1 中 的 “后 面 可 跟 ……” 那 一 列 给 出 了 允许 的 记号 。 例 如 ， 
模式 $x:expr ~ $y:expr 是 错误 的 ， 因 为 ~ 不 允许 出 现在 expr 后 面 。 模 式 $vars:path : 
$t:ty 则 没有 问题 ， 因 为 $vars:path 后 面 跟 着 一 个 冒号 ， 而 冒号 是 允许 出 现在 path 后 面 
的 ，$t:ty 后 面 什么 也 没有 ， 这 当然 没有 问题 。 


20.4.2 ”在 宏 里 使 用 递归 

前 面 已 经 展示 过 一 个 在 宏 中 自我 调用 的 简单 例子 : vec! 宏 的 实现 使 用 递归 支持 了 末尾 的 分 
号 。 下 面 来 看 一 个 更 重要 的 例子 json! 也 需要 递归 调用 自己 。 

可 以 先 试 试 不 使 用 递归 来 支持 JSON 数组 ， 比 如 : 


([ $( S$element:tt ),* ]) => { 
Json::Array(vec![ $( S$element ),* ]) 







































































六 
但 这 样 不 行 。 这 样 会 把 JSON 数据 ($element 记号 树 ) 直接 粘贴 到 一 个 Rust 表达 式 中 。 但 
它们 是 两 种 不 同 的 语言 。 
为 此 ， 需 要 把 数组 中 的 每 个 元 素 都 从 JSON 转换 为 Rust。 所 幸 的 是 ， 有 一 个 宏 正 是 做 这 个 
用 的 ， 它 就 是 我 们 正在 写 的 这 个 ! 


([ $($element:tt),* ]) =>{ 
Json::Array(vec![ $( json!($element) ),* ]) 





}; 
对 象 也 可 以 采用 同样 的 方式 获得 支持 : 
({ $C($key:tt : $value:tt),* }) => { 
Json: :0bject(Box: :new(vec![ 
$( ($key.to_string(), json!($value)) ),* 
].into iter().collect())) 


3 


编译 器 对 宏 施 加 了 一 个 递归 次 数 的 限制 ， 默 认为 64 次 调用 。 这 对 于 json! 常规 使 用 已 经 足 
够 了 ,但 特别 复杂 情况 下 的 递归 有 可 能 会 磁 到 这 个 限制 。 为 此 ， 可 以 在 使 用 这 个 宏 的 包 顶 
部 添加 如 下 属性 : 


#![recursion_limit = "256"] 


我 们 的 json! 宏 差 不 多 要 完成 了 。 剩 下 的 工作 是 支持 布尔 值 、 数 值 和 字符 串 值 。 
20.4.3 ”在 宏 里 使 用 特 型 


编写 复杂 的 宏 总 会 遇 到 难题 。 重 要 的 是 要 记 住 ， 宏 本 身 并 非 解决 验证 唯一 的 工具 。 











这 里 ， 我 们 需要 支持 json!(true)、json!(1.0) 和 json!("yes")， 将 这 些 (涵盖 各 种 可 能 性 
的 ) 值 转换 为 适当 的 Json 值 。 但 宏 并 不 擅长 区 分 类 型 。 可 以 想象 如 下 实现 : 
macro_rules! json { 


(true) => { 
Json: :Boolean(true) 








}; 
(false) => { 
Json: :Boolean(false) 


}; 
i ed 
这 种 方式 一 看 就 行 不 通 。 布 尔 值 只 有 两 种 可 能 性 ， 但 数值 呢 ?” 更 不 用 说 字符 串 了 。 
好 在 我 们 有 一 个 把 不 同类 型 值 转换 为 某 种 指定 类 型 的 标准 方式 : 13.9 市 介绍 的 Fron 特 型 。 
只 需 为 儿 个 类 型 实现 这 个 特 型 : 


impl From<booL> for Json { 
fn from(b: bool) -> Json { 
Json: :Boolean(b) 








} 
} 


impl From<i32> for Json { 
fn from(i: i32) -> Json { 
Json: :Number(i as f64) 
3 
} 


impl From<String> for Json { 
fn from(s: String) -> Json { 
Json::String(s) 
} 
} 


impl<'a> From<&'a str> for Json { 
fn from(s: &'a str) -> Json { 
Json::String(s.to_string()) 


} 








事实 上 ， 全 部 12 种 数值 类 型 的 实现 都 非常 相似 。 因 此 有 必要 专门 为 此 写 一 个 宏 ， 以 避免 
元 余 的 复制 - 粘贴 : 
macro_ruLes! impL from_num_for_json { 


(5( St:tdent )* ) => { 
$( 








impl From<$t> for Json { 
fn from(n: St) -> Json { 
Json: :Number(n as f64) 


} 
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} 


impL_from_num_for_json!(u8 i8 uy16 i16 uy32 i32 uy64 i64 usize isize f32 f64); 


这 样 就 可 以 使 用 Json::from(value) 将 任何 支持 类 型 的 值 转换 为 Json 了 。 在 我 们 的 宏 里 ， 


可 以 这 相 


并 
}; 


使 用 : 





(Sother :tt) => { 


Json: :from($other) // 处 理 布尔 值 、 数 值 和 字符 串 


}; 
在 我 们 的 json! 宏 中 加 上 这 条 规则 ， 让 它 通 过 目前 为 止 所 有 的 测试 。 所 有 代码 合 在 一 起 ， 
就 是 这 个 样子 : 
macro_rules! json { 
(null) => { 
Json: :NULL 
}; 


} 


额外 特 


let 
let 


([ $($element:tt),* ]) => { 
Json::Array(vec![ $( json!($element) ),* ]) 
}; 
({ $C($key:tt : $value:tt),* }) => { 
Json: :Object(Box: :new(vec![ 
$( ($key.to_string(), json!($value)) ),* 
].into_iter().collect())) 
}; 
(Sother:tt) => { 
Json::from($other) // 处 理 布尔 值 、 数 值 和 字符 是 


bot 
ey 








3 





width = 4.0; 
desc = 
json!({ 
"width": width, 
"height": (width * 9.0 / 4.0) 
}); 





结果 ， 这 个 宏 意 外 地 支持 在 JSON 数据 中 使 用 变量 ， 其 至 任意 Rust 表达 式 ， 这 是 个 方便 的 
性 


因为 (width * 9.0 / 4.0) 加 了 圆 括号 ， 所 以 它 是 一 个 单独 的 记号 树 ， 结 果 这 个 宏 在 解析 
对 象 时 用 $value:tt 成 功 匹配 到 了 它 。 


20.4.4 ”作用 域 与 自净 宏 


编写 宏 的 一 个 比较 隐 星 的 鸡 














的 第 三 个 规则 )， 以 避免 使 用 临时 向 量 。 可 以 这 样 来 写 : 


ee ni me 接 下 来 我 们 会 介 
绍 Rust 处 理 作 用 域 的 两 种 方式 ， 一 种 针对 局 部 变量 和 参数 ， 另 一 种 针对 其 他 情况 


为 说 明 这 个 问题 的 重要 性 ， 下 面 先 重 写 一 下 解析 JSON 对 象 的 规则 (前面 展示 的 json! 宏 


二 
全 





({ $C($key:tt : $value:tt),* }) => { 
{ 


Let mut fields = Box::new(HashMap: :new()); 
$( fields.insert($key.to_string(), json!(S$value)); )* 
Json: :0bject(fields) 
} 
}; 


现在 ， 填 充 HashMap 是 通过 重复 调用 .insert() 方法 而 不 是 使 用 collect() 来 实现 的 。 这 意 
味 着 需要 把 这 个 映射 保存 在 一 个 临时 变量 ， 也 就 是 这 里 的 fields 中 。 


但 是 如 果 调 用 json! 的 代码 恰好 也 使 用 了 自己 所 拥有 的 一 个 变量 ， 而 且 这 个 变量 也 叫 fields 
该 怎么 办 呢 ? 


Let fields = "Fields, W.C."; 

let role = json!({ 
"name": "Larson E. Whipsnade", 
"actor": fields 


})3 
扩展 这 个 宏 会 把 两 块 代码 粘贴 在 一 起 ， 两 边 都 使 用 了 名 字 fields， 但 保存 的 数据 不 同 1 


let fields = "Fields, W.C."; 

let role = { 
Let mut fieLds = Box::new(HashMap: :new()); 
fields.insert("name".to_string(), Json::from("Larson E. Whipsnade")); 
fields.insert("actor".to_string(), Json::from(fields)); 
Json: :Object(fields) 








3 


看 起 来 只 要 宏 使 用 了 临时 变量 ， 这 似乎 就 是 一 个 无 法 避免 的 陷阱 ， 你 可 能 已 经 在 思考 可 能 
的 解决 方案 了 。 或 许 应 该 把 json! 宏 里 使 用 的 变量 重 命名 为 一 个 调用 者 不 太 可 和 E 传 进来 的 
名 字 ， 比 如 不 叫 fields， 而 吊 __jsons$fields。 


令 人 惊喜 的 是 宏 就 是 这 样 做 的 。Rust 会 这 样 为 我 们 重新 命名 变量 ! 这 个 特性 最 初 是 在 
Scheme 宏 里 实现 的 ， 叫 作 自 净 (hygiene)。 所 以 Rust 也 说 自己 有 自净 宏 。 


理解 宏 自 净 的 最 简单 方式 是 在 宏 每 次 被 扩展 时 ， 都 会 给 来 自 宏 自 身 的 这 部 分 代码 染 上 不 同 
的 颜色 。 


这 样 ， 不 同 颜色 的 变量 就 被 当成 不 同 的 名 字 来 对 待 了 : 


Let fields = "Fields, W.C."; 

Let role = { 
Let mut fields = Box::new(HashMap: :new()); 
fields.insert("name".to_string(), Json::from("Larson E. Whipsnade")); 
fields.insert("actor".to_string(), Json::from(fields)); 
Json: :0bject(fields) 


























， 由 宏 调 用 者 粘贴 进来 且 会 粘贴 到 输出 的 代码 ， 比 如 "name" 和 "actor"， 仍 会 保持 其 
人 (黑色 )。 只 有 源 自 宏 模 板 的 记号 才 被 染 了 色 。 


现在 就 有 了 一 个 (在 调用 者 中 声明 的 ) 名 为 fields 的 变量 和 另 一 个 (由 宏 引 入 的 ) 名 为 
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fields 的 变量 。 因 为 两 个 名 字 的 颜色 不 同 ， 所 以 它们 不 会 被 混 消 。 
如 果 宏 真 的 需要 引用 调用 者 作用 域 中 的 变量 ,， 调 用 者 就 必须 把 这 个 变量 的 名 字 传 给 宏 。 


(染色 的 比喻 并 不 代表 它 就 是 自净 的 真实 工作 方式 。 真 正 的 机 制 比 这 还 要 稍微 智能 一 些 。 
如 果 两 个 标识 符 相 同 ， 不 管 什么 “颜色 ”， 只 有 它们 都 指向 宏 及 其 调用 者 所 在 作用 域 的 公 
共 变 量 ， 才 会 被 认为 是 相同 的 。 但 这 种 情况 在 Rust 中 很 少见 。 如 果 你 理解 了 前 面 的 例子 ， 
那么 对 自净 宏 的 认识 就 够 了 。) 
你 可 能 注意 到 了 ， 在 这 个 宏 被 扩展 时 ， 其 他 几 个 标识 符 被 染 上 了 不 止 一 种 颜色 ， 比 如 Box、 
HashMap 和 Json 的 颜色 就 不 一 样 。 虽 然 颜 色 不 同 ， 但 Rust 识别 这 些 类 型 名 并 非 难 事 ， 因 
为 Rust 中 的 自净 只 限于 局 部 变量 和 参数 。 如 果 遇 到 常量 、 类 型 、 方 法 、 模 块 和 宏 名 字 ， 那 
Rust 就 是 “色盲 ”了 。 

这 意味 着 如 果 一 个 模块 要 使 用 我 们 的 json! 宏 ， 而 Box、HashMap 或 Json 并 不 在 这 个 模块 
的 作用 域 中 ， 那 宏 就 不 会 起 作用 。 下 一 节 会 介绍 如 何 避 免 这 个 问题 。 

首先 ， 我们 要 知道 Rust 的 严格 自净 会 带 来 阻碍 ， 需 要 先 解 决 这 个 问题 。 假 设 有 很 多 函数 要 
包含 下 面 这 行 代码 : 


let req = ServerRequest: :new(server_socket.session()); 


复制 粘贴 这 行 代码 是 件 痛苦 的 事 。 能 不 能 写 个 安 来 代替 呢 ? 


macro_rules! setup req { 
() => { 


Let req = ServerRequest::new(server_socket.session()); 


































































































} 
} 


fn handle_http_request(server_socket: &ServerSocket) { 
setup_req!(); // 声明 req， 使 用 server_socket 
使 用 req 的 代码 














像 这 样 写 是 不 行 的 。 它 需要 宏 里 的 server_socket 引用 在 函数 中 声明 的 局 部 变量 server_ 
socket， 对 变量 req 则 正好 相反 。 但 自净 阻止 了 宏 里 的 名 字 与 其 他 作用 域 中 名 字 的 “ 冲 
突 ”。 即 使 在 这 种 情况 下 也 是 一 样 ， 而 这 种 “冲突 ” 正 是 我 们 想 要 的 。 
解决 方案 是 给 宏 传 入 你 想 同 时 在 宏 代 码 内 部 和 外 部 使 用 的 标识 符 : 

macro_rules! setup req { 


($req:ident, $server_socket:ident) => { 
let $req = ServerRequest::new($server_socket.session()); 
































} 


fn handle_http_request(server_socket: &ServerSocket) { 
setup_req!(req, server_socket); 


..。// 使 用 req 的 代码 





因为 此 时 的 req 和 server_socket 是 由 函数 提供 的 ， 所 以 它们 的 “颜色 ”自然 就 代表 那个 
作用 域 。 








自净 使 得 这 个 宏 使 用 起 来 有 点 烦琐 ， 不 过 这 是 一 个 特性 ， 而 不 是 bug。 很 容易 推断 ， 自 将 
宏 知 道 不 能 背 着 你 干扰 局 部 变量 。 如 果 在 函数 中 搜索 某 个 标识 符 ， 比 如 server_socket， 你 
会 发 现 使 用 它 的 所 有 地 方 ， 包 括 宏 调用 。 


20.4.5 ”导入 和 导出 宏 


由 于 宏 是 在 编译 早期 被 扩展 的 ， 因 此 在 Rust 知道 你 项 目的 整个 模块 结构 之 前 ， 它 们 不 能 以 
常规 方式 导入 和 导出 。 


在 只 有 一 个 包 的 情况 下 : 


在 一 个 模块 中 可 见 的 宏 会 自动 在 其 子 模块 中 可 见 ， 
。 要 从 一 个 模块 中 “向 上 ”把 宏 导 出 到 其 父 模 块 ， 需 要 使 用 #[macro_use] 属性 。 例 如 ， 
假设 我 们 的 lib.rs 包含 如 下 代码 : 
#[macro_use] mod macros; 


mod client; 
mod server; 


所 有 在 macros 模块 中 定义 的 宏 都 会 导入 lib.rs 中 ， 因 此 对 这 个 包 的 其 他 部 分 也 是 可 见 
的 ， 包 括 client 和 server 。 


在 使 用 多 个 包 的 情况 下 : 


。 要 从 另 一 个 包 导 入 宏 ， 需 要 在 extern crate 声明 上 使 用 #[macro_use]; 
。 要 从 一 个 包 中 导出 宏 ， 需 要 将 每 个 要 公开 的 宏 都 标记 为 #[macro_export]。 


当然 ， 添 加 上 述 任 何 属性 或 标记 ， 都 意味 着 你 的 宏 可 能 会 被 其 他 模块 调用 。 为 此 ， 导 出 的 
宏 不 应 该 依赖 于 作用 域 中 存在 某 种 东西 ， 因 为 谁 也 不 知道 使 用 它 的 作用 域 中 会 有 什么 。 就 
算 标 准 前 置 模块 中 的 特性 仍然 有 被 遮蔽 的 可 能 。 


相反 ， 对 外 的 宏 应 该 使 用 绝对 路 径 指 向 自己 使 用 的 任何 名 字 。macro_rules! 以 一 个 特殊 的 
片段 $crate 为 此 提供 便利 。 这 个 片段 类 似 于 宏 定 义 所 在 包 的 根 模块 的 绝对 路 径 。 比 如 ， 不 
要 使 用 Json， 而 是 写成 $crate::JSon。 这 样 即 使 没有 导入 Json， 你 的 宏 也 可 以 照样 使 用 。 
HashMap 也 可 以 被 修改 为 ::std::collections::HashMap 或 $crate::macros::HashMap。 对 后 
一 种 写法 ， 还 必须 再 导出 HashMap， 因 为 $crate 不 能 用 于 访问 包 的 私有 特性 。 它 实际 上 会 
被 扩展 为 类 似 : :jsontLib 这 样 的 形式 ， 这 是 一 个 普通 路 径 。 可 见 性 规则 并 不 会 受 影响 。 


当 把 宏 转 移 到 它 自 己 的 模块 macros 中 并 修改 为 使 用 $crate 之 后 ， 它 就 变 成 了 下 面 这 样 。 
这 是 最 终 的 版 本 。 


// macros.rs 

pub use std::collections::HashMap; 
pub use std: :boxed: :Box; 

pub use std::string::ToString; 













































































#[macro_export] 
macro_rules! json { 
(null) => { 
$crate::Json: :Null 
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([ $( $element:tt ),* ]) => { 

$crate::Json::Array(vec![ $( json!(sSeLement) ),* ]) 
}; 
({ $C $key:tt : $value:tt ),* }) => { 

{ 


Let mut fields = $crate::macros::Box::new( 
$crate: :macros: :HashMap: :new()); 
$( fields.insert($crate::ToString::to_string($key), json!($value)); )* 
$crate: :Json::0bject(fields) 
} 
}s 
(Sother :tt) => { 
$crate: :Json: :from($other) 
汇 
} 


由 于 .to_string() 方法 源 自 标准 的 Tostring 特 型 ， 因 此 这 里 也 使 用 了 $crate 来 引用 它 ， 所 
用 语法 是 11.3 节 介 绍 过 的 完全 限定 的 方法 调用 形式 : $crate::ToString::to_string($key)。 
对 这 个 宏 而 言 ， 并 不 是 必须 这 样 引 用 才能 保证 其 工作 ， 因 为 Tostring 位 于 标准 前 置 模块 。 
不 过 ， 如 果 你 的 宏 用 到 了 一 个 调用 它 时 可 能 并 不 在 作用 域内 的 特 型 方法 ， 那 么 完全 限定 的 
方法 调用 是 最 佳 选择 。 


20.5 ”匹配 时 避免 语法 错误 
下 面 的 宏 看 似 合 理 ， 但 会 给 Rust 制造 麻烦 : 


macro_rules! complain { 
(Smsg:expr) => { 
println!("Complaint filed: {}", $msg); 
}; 
(user : $userid:tt , $msg:expr) => { 
println!("Complaint from user {}: {}", $userid, $msg); 
































3 
} 
假设 这 样 调用 它 : 





complain!(user: "jimb", "the AI lab's chatbots keep picking on me"); 


肉眼 可 见 ， 这 明显 匹配 第 二 个 模式 。 但 Rust 会 先 尝试 匹配 第 一 个 模式 ， 企 图 用 $msg:expr 
来 匹配 所 有 输入 。 对 我 们 而 言 ， 这 就 是 问题 的 根源 。 当 然 ，user: "jimb" 不 是 表达 式 ， 
此 我 们 会 得 到 一 个 语法 错误 。Rust 拒绝 掩盖 语法 错误 ， 毕 竞 宏 已 经 很 难 调 坛 了。 相反 ， 它 
会 立即 报告 这 个 错误 ， 停 止 编译 。 

如 果 是 模式 中 的 记号 匹配 失败 ，Rust 就 会 切换 到 下 一 条 规则 。 只 有 语法 错误 是 致命 的 ， 而 
且 只 在 匹配 片段 的 时 候 才 会 发 生 。 

这 里 的 问题 并 不 难 理解 : 我 们 是 在 一 个 错误 的 规则 中 企图 匹配 片段 $imsg:expr。 结 果 并 不 
匹配 ， 因 为 我 们 甚至 都 不 应 该 出 现在 这 里 。 调 用 者 想 匹 配 的 是 其 他 规则 。 有 两 个 简单 的 方 
法 能 避免 这 个 问题 。 









































第 一 个 方法 是 避免 容易 混淆 的 规则 。 比 如 ， 可 以 改 一 改 这 个 宏 ， 让 它 的 每 个 模式 都 以 一 个 
不 同 的 标识 符 开头 : 
macro_rules! complain { 
(msg : $msg:expr) => { 
println!("Complaint filed: {}", $msg); 
}; 
(user : S$userid:tt , msg : $msg:expr) => { 
println!("Complaint from user {}: {}", $userid, $msg); 
}; 
} 
如 果 宏 参数 以 msg 开头 ， 就 匹配 规则 一 ， 如 果 以 user 开头 ， 就 匹配 规则 二 。 无 论 参数 是 什 
么 ， 我 们 都 会 在 匹配 片段 之 前 就 知道 正确 的 规则 。 


另 一 个 避免 这 种 欺骗 性 语法 错误 的 方法 是 把 更 具体 的 规则 放 在 前 面 。 把 user : 规则 放 到 前 
面 就 可 以 修改 complain! 的 问题 ， 因 为 永远 不 会 磁 到 会 导致 语法 错误 的 规则 。 


20.6 ”超越 macro_rules! 

宏 模 式 可 以 解析 比 JSON 更 复杂 的 输入 ， 不 过 我 们 发 现 这 种 复杂 性 很 快 就 会 失控 。 

Daniel Keep 等 人 编写 的 The Little Book of Rust Macros 是 一 本 非常 棒 的 高 级 macro_rules! 
编程 指责。 这 本 书 讲解 清晰 、 构 思 巧 妙 ， 比 本 章 更 详细 地 介绍 了 宏 扩 展 的 方方面面 。 它 也 
展示 了 一 些 非常 聪明 的 技术 ， 比 如 把 macro_rules! 模式 作为 一 种 小 众 编程 语言 集成 到 服务 
中 ， 去 解析 复杂 和 输入。 我 们 对 这 种 做 法 并 不 热衷 。 建 议 大 家 小 心 使 用 。 

Rust 1.15 引入 了 一 种 不 同 的 机 制 ， 叫 过 程 宏 (procedural macro)。 这 个 特性 支持 扩展 
#[derive] 属性 ， 以 处 理 自 定义 特 型 ， 如 图 20-4 所 示 。 


















































#[derive(Copy, Clone, PartialEq, Eq, IntojJson)] 
struct Money { 
dollars: U32， 定义 派生 
cents: U16， 





























图 20-4: 通过 #[derive] 属性 调用 假想 的 IntoJson 过 程 宏 


没有 IntoJson 特 型 ， 但 没关系 : 过 程 宏 可 以 利用 这 个 接 入 点 插入 它 想 要 的 任何 代码 (在 这 


里 ， 可 能 是 impL From<Money> for Json { ... })。 


过 程 安之 所 以 是 “过 程 ”， 主 要 因为 它 是 作为 Rust 函数 实现 的 ， 并 非 一 个 声明 性 的 规则 集 。 
在 写作 本 书 时 ， 过 程 宏 仍 然 是 一 个 新 特性 ， 还 会 继续 发 展 ， 因 此 建议 大 家 关注 其 在 线 文 档 。 
看 到 这 里 ， 或 许 你 已 经 不 喜欢 宏 了 。 然 后 呢 ? 一 个 替代 方案 是 使 用 构建 脚本 生成 Rust 代 
码 。Cargo 文档 中 关于 构建 脚本 的 内 容 展示 了 如 何 一 步 一 步 来 操作 。 总 之 就 是 写 一 个 程序 ， 
让 它 生成 你 想 要 的 Rust 代码 。 然 后 在 Cargo.toml 中 加 上 一 行 ， 以 便 在 构建 期 间 同时 运行 该 
程序 ， 并 且 使 用 inctlude! 把 生成 的 代码 包含 到 你 的 包 中 。 
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不 安全 代码 





希望 没有 人 认为 我 软弱 、 无 能 、 消 沉 ; 
希望 他 们 理解 我 的 与 众 不 同 : 

对 敌人 是 威胁 ， 对 朋友 很 忠诚 。 

这 样 的 生活 无 上 荣 焰 。 





Medea, Euripides 
系统 编程 不 为 人 知 的 乐趣 在 于 ， 在 每 一 个 安全 语言 和 精心 设计 的 抽象 之 下 ， 都 奔腾 着 狂放 
不 时 的 不 安全 机 器 语言 和 自由 散漫 的 位 。 在 Rust 中 也 可 以 写 出 这 种 代码 。 
迄今 为 止 ， 本 书 介绍 的 这 门 语 言 借助 类 型 、 生 命 期 、 边 界 检 查 等 手段 ， 可 以 完全 自动 化 地 
保证 你 的 程序 没有 内 存 错误 和 数据 争 用 。 但 这 种 自动 化 推理 有 其 局 限 性 ，Rust 中 很 多 有 价 
值 的 技术 并 不 能 认为 是 安全 的 。 
不 安全 的 代码 让 你 告诉 Rust:“ 这 时 候 ， 信 任 我 。 通过 把 一 个 块 或 函数 标记 为 不 安全 ， 你 
可 以 获得 调用 标准 库 中 unsafe 函数 、 解 引用 不 安全 指针 和 调用 以 其 他 语言 (比如 C 和 
C++) 编写 的 函数 等 能 力 。Rust 所 有 常规 的 安全 检查 仍然 适用 : 类 型 检查 、 生 命 期 检查 ， 
以 及 对 索引 的 边界 检查 都 会 正常 进行 。 不 安全 代码 只 是 启用 了 一 小 部 分 额外 的 特性 。 
跨越 到 安全 Rust 边界 之 外 的 能 力也 是 Rust 实现 自身 很 多 最 基本 特性 的 基础 ， 就 像 C 
和 C++ 系统 通常 所 做 的 那样 。 不 安全 代码 可 以 让 vec 类 型 更 高 效 地 管理 其 缓冲 区 ， 让 
std: :io 模块 与 操作 系统 交谈 ， 让 std: :thread 和 std: :sync 模块 提供 并 发 原 语 。 


本 章 介绍 了 如 下 使 用 不 安全 特性 的 基础 知识 。 


。 Rust 的 unsafe 块 用 于 将 普通 的 、 安 全 的 Rust 代码 与 使 用 不 安全 特性 的 代码 隔离 开 。 
。 可 以 将 函数 标记 为 unsafe， 提 醒 调用 者 注意 遵循 领 外 的 协议 ， 以 避免 未 定义 行为 。 
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原始 指针 及 它们 的 方法 可 以 不 受 限 制 地 访问 内 存 ， 从 而 构建 正常 情况 下 Rust 类 型 系统 
会 禁止 的 数据 结构 。 
。 理解 未 定义 行为 的 定义 可 以 帮 你 认识 到 为 什么 它 意味 着 极为 严重 的 后 果 ， 而 不 仅仅 是 得 
到 错误 的 结果 。 
。 Rust 的 外 来 函数 接口 让 你 能 够 使 用 其 他 语言 编写 的 库 。 
不 安全 特 型 ， 类 似 于 unsafe 畏 数 ， 对 所 有 实现 〈 而 非 调用 者 ) 添加 了 必须 遵守 的 协议 。 


21.1 不 安全 源 自 哪里 


本 书 一 开始 就 展示 了 一 个 由 于 没有 遵守 C 标准 中 规则 而 意外 崩溃 的 C 程序 。 在 Rust 中 也 
可 以 做 到 : 


$ cat crash.rs 
fn main() { 
Let mut a: usize = 0; 
let ptr = &mut a as *mut usize; 
unsafe { 
*ptr.offset(3) = Ox7ffff72f484c; 



































上 


$ cargo build 
Compiling unsafe-samples vO.1.0 
Finished debug [unoptimized + debuginfo] target(s) in 0.44 secs 

$ ../../target/debug/crash 

crash: Error: .netrc file is readable by others. 

crash: Remove password or make file unreadable by others. 

Segmentation fault (core dumped) 

$ 
这 个 程序 借用 了 本 地 变量 a 的 一 个 可 修改 引用 ， 将 其 转型 为 一 个 原始 指针 类 型 *mut 
usize， 然 后 使 用 offset 方法 在 内 存 中 又 产生 了 一 个 3 个 字 的 指针 。 这 个 地 址 恰好 是 存储 
main 返回 地 址 的 位 置 。 由 于 程序 用 一 个 常量 覆盖 返回 地 址 ， 因 此 maiin 的 返回 行为 就 变 得 
非常 奇怪 。 导 致 这 次 月 溃 的 原因 是 程序 错误 地 使 用 了 不 安全 特性 一 一 具体 来 说 就 是 解 引 用 
原始 指针 的 能 
不 安全 特性 都 会 附带 一 个 协议 (contract)， 也 就 是 Rust 不 能 自动 强制 的 规则 。 对 这 个 协 
议 ， 你 必须 遵循 ， 否 则 就 会 导致 未 定义 行为 (undefined behavior) 。 


协议 并 不 止 常规 的 类 型 检查 和 生命 期 检查 ， 而 是 对 特定 不 安全 特性 做 了 进一步 约束 。 通 
常 ，Rust 本 身 并 不 知道 有 协议 ， 因 为 这 些 协 议 只 存在 于 相关 特性 的 文档 中 。 例 如 ， 原 始 指 
针 类 型 有 一 个 协议 ， 就 是 禁止 解 引 用 已 经 超出 其 最 初 引用 值 边界 的 指针 。 前 面 例子 中 的 表 
达 式 *ptr.offset(3) = .… 违反 了 这 个 协议 。 不 过 ， 正 如 代码 输出 所 示 ，Rust 毫 无 候 言 地 
编译 了 这 段 程序 ， 因 为 它 的 安全 检查 没有 检测 到 这 个 违反 协议 的 地 方 。 因 此 在 使 用 不 安全 
特性 时 ， 作 为 程序 员 就 要 承担 起 检查 你 的 代码 是 否 遵守 了 它们 协议 的 职责 。 

很 多 特性 需要 遵循 一 些 规则 才能 正确 使 用 ， 不 过 这 些 规则 并 不 是 这 里 所 说 的 协议 ， 除 非 韦 
反 它们 的 结果 包含 未 定义 行为 。 未 定义 行为 是 Rust 坚决 认为 你 的 代码 永远 不 会 出 现 的 行 
为 。 例 如 ，Rust 认为 你 不 会 用 其 他 东西 覆盖 一 个 函数 调用 的 返回 地 址 。 能 够 通过 Rust 党 
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规 安全 检查 并 按照 它 所 使 用 特性 协议 编译 的 代码 不 可 能 做 这 样 的 事 。 前 面 的 程序 违反 了 这 
个 原始 指针 协议 ， 其 行为 是 未 定义 的 ， 它 已 经 脱离 了 正轨 。 

如 果 你 的 代码 表现 出 未 定义 行为 ， 那 你 已 经 破坏 了 跟 Rust 之 间 一 半 的 约定 ，Rust 拒绝 预 
测 后 果 。 从 系统 库 和 崩溃 中 发 据 不 相关 的 错误 消息 是 一 种 可 能 的 后 果 ， 把 你 计算 机 的 控制 
权 拱 手 让 给 攻击 者 则 是 另 一 种 可 能 的 后 果 。 最 终 效 果 可 能 因 Rust 发 布 的 版 本 而 不 同 ， 没 有 
警告 。 不 过 有 时 候 ， 未 定义 行为 未 必 有 可 见 的 后 果 。 例 如 ， 如 果 main 函数 永远 不 返回 ( 比 
如 调用 std: :process: :exit 提前 终止 程序 ) ， 那 么 被 破坏 的 返回 地 址 可 能 就 不 是 问题 。 


应 该 只 在 unsafe 块 或 unsafe 函数 中 使 用 不 安全 特性 ， 接 下 来 几 市 将 分 别 介 绍 它们 。 这 样 
可 以 避免 在 不 知 不 觉 中 使 用 不 安全 特性 ， 因 为 使 用 不 安全 特性 时 必须 先 写 一 个 unsafe 块 或 
国 数 。Rust 确保 你 一 定 知道 了 自己 的 代码 可 能 要 遵守 额外 的 规则 。 


21.2 不 安全 的 块 
unsafe 块 就 是 在 普通 Rust 块 前 面 加 上 unsafe 关键 字 ， 然 后 就 可 以 在 块 中 使 用 不 安全 特 
性 了 : 


unsafe { 
String::from_utf8_unchecked(ascii) 
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如 果 块 前 面 没有 unsafe 关键 字 ， 那 么 Rust 会 反对 使 用 from_utf8_unchecked， 因 为 它 是 一 
个 unsafe 国 数 。 而 有 了 unsafe 块 ， 这 行 代码 你 想 在 哪里 使 用 就 在 哪里 使 用 。 


与 普通 Rust 块 一 样 ，unsafe 块 的 值 是 它 最 后 表达 式 的 值 ， 如 果 没 有 表达 式 就 是 ()。 前 面 
展示 的 对 String: :from_utf8_unchecked 的 调用 提供 了 那个 块 的 值 。 


unsafe 块 解 锁 了 4 个 额外 选项 。 


。 可 以 调用 unsafe 函数 。 每 个 unsafe 函数 必须 根据 自己 的 意图 指定 自己 的 协议 。 

。 可 以 解 引 用 原始 指针 。 安 全 代码 可 以 传递 原始 指针 、 比 较 它们 ， 以 及 通过 从 引用 (其 至 
整数 ) 转换 创建 它们 ， 但 只 有 不 安全 代码 才 可 以 真正 使 用 它们 访问 内 存 。21.7 节 将 详细 
介绍 原始 指针 并 解释 如 何 安全 地 使 用 它们 。 

。 可 以 访问 可 修改 static 变量 。 正 如 19.3.11 节 所 解释 的 ，Rust 无 法 确定 线程 什么 时 候 使 
用 的 是 可 修改 static 变量 。 因 此 它们 的 协议 要 求 你 保证 所 有 访问 必须 适当 同步 过 。 

。 可 以 访问 通过 Rust 的 外 来 函数 接口 声明 的 函数 和 变量 。 即 使 是 不 可 修改 的 ， 这 些 函 数 
和 变量 也 会 被 认为 是 不 安全 的 。 因 为 它们 对 其 他 语言 写 的 代码 是 可 见 的 ， 而 那些 代码 不 
一 定 遵守 Rust 的 安全 规则 。 


将 不 安全 特性 限制 在 unsafe 块 并 不 会 真正 妨碍 你 做 任何 想 做 的 事 。 你 的 代码 完全 可 以 只 

有 一 个 unsafe 块 ， 然 后 想 怎 么 写 都 行 。 这 条 规则 的 主要 目的 是 引起 人 们 注意 ， 告 诉 大 家 

Rust 并 不 保证 这 里 面 代码 的 安全 。 

。 你 不 会 意外 使 用 不 安全 特性 ， 然 后 发 现 自己 要 遵守 根本 都 不 知道 的 协议 。 

。 评审 代码 的 人 会 格外 关注 unsafe 块 。 某 些 项 目 甚至 会 自动 把 影响 unsafe 块 的 改动 标示 
出 来 ， 以 吸引 特殊 关注 。 
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。 在 写 unsafe 块 时 ， 你 可 以 先 思考 片刻 ， 问 自己 是 不 是 真 的 需要 采取 这 种 手段 。 如 果 是 
为 了 性 能 ， 那 有 没有 测试 数据 表明 这 实际 上 是 一 个 频 颈 ? 也 许 使 用 安全 Rust 做 同一 件 
事 才 是 最 好 的 。 


示例 : 高 效 ASCII 字 符 串 类 型 


下 面 展示 了 一 个 Ascii 的 定义 ， 即 一 个 字符 串 类 型 ， 确 保 其 内 容 始终 是 有 效 的 ASCII。 这 
个 类 型 使 用 了 一 个 不 安全 特性 提供 到 String 的 零 开销 转换 ， 


mod my_ascii { 


} 








use std::ascii::AsciiExt; // 为 使 用 u8: :is_ascii 


/// 一 个 ASCII 编 码 字符 串 

#[derive(Debug, Eq, PartialEq)] 

pub struct Ascii( 
// 这 里 必须 只 保存 格式 正确 的 ASCII 文 本 : 
// 即 字 节 从 0 到 0x7f 
Vec<Uu8> 


); 


impl Ascii { 
/// 基于 bytes 中 的 ASCII 文 本 创建 Ascii。 如 果 bytes 中 包含 
/// 任何 EASCII 字 符 ， 则 返回 一 个 NotAsciiError 错 误 
pub fn from bytes(bytes: Vec<y8>) -> Result<Ascii, NotAsciiError> { 
if bytes.iter().any(|&byte| !byte.is ascii()) { 
return Err(NotAsciiError(bytes)); 














} 
Ok(Ascii(bytes)) 
} 


// 转换 失败 时 ， 返 回 这 个 不 能 转换 的 向 量 

// 这 里 应 该 实现 std: :error::Error， 为 简单 起 见 就 省 略 了 
#[derive(Debug, Eq, PartialEq)] 

pub struct NotAsciiError(pub Vec<u8>); 





























// 安全 、 高 效 的 转换 ， 使 用 不 安全 代码 实现 
impl From<Ascii> for String { 
fn from(ascii: Ascii) -> String { 
// 如 果 模 块 没 有 bug， 这 是 安全 的 ， 因 为 格式 正确 的 
// ASCII 文 本 也 是 格式 正确 的 UTF-8 


unsafe { String::from utf8_unchecked(ascii.0) } 








= 


这 个 模块 的 关键 是 Ascii 类 型 的 定义 。 这 个 类 型 本 身 标记 为 pub， 因 此 对 my_ascii 模块 外 
部 是 可 见 的 。 但 它 的 Vec<u8> 元 素 不 是 公有 的 ， 因 此 只 有 my_ascii 模块 可 以 构建 Ascii 值 
或 引用 其 元 素 。 这 样 ， 模 块 的 代码 就 可 以 对 出 现 或 没 出 现在 这 里 的 代码 拥有 完全 控制 权 。 














只 要 公有 构造 函数 和 方法 保证 新 建 的 Ascii 值 格式 正确 ， 而 且 在 它们 的 生命 期 内 始终 如 此 ， 
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程序 的 其 他 部 分 就 不 会 违反 这 个 规则 。 而 且 确 实 ， 公 有 构造 函数 Ascii: :from_bytes 在 根 
据 传人 的 向 量 构建 Ascii 之 前 ， 也 对 其 进行 了 仔细 的 检查 。 为 了 简洁 起 见 ， 我 们 没有 展示 
任何 方法 ,但 大 家 可 以 想象 这 里 有 一 组 文本 处 理 方法 ， 这 些 方 法 始终 可 以 保证 Ascii 值 包 
含 正确 的 ASCII 文本 。 就 像 String 的 方法 保证 它 的 内 容 始终 是 格式 正确 的 UTF-8 一 样 。 


这 样 一 来 ， 就 可 以 非常 高 效 地 为 String 实现 From<Ascii> 了 。 不 安全 国 数 String::from_ 
utf8_unchecked 接收 一 个 字 节 向 量 ， 然 后 根据 它 构建 一 个 String， 而 无 须 检查 其 内 容 是 不 
是 格式 正确 的 UTF-8 文本 。 这 个 函数 的 协议 要 求 调用 者 对 此 承担 责任 。 所 幸 的 是 ，Ascii 
类 型 要 求 的 规则 也 是 我 们 需要 满足 from_utf8_unchecked 协议 的 条 件 。 正 如 17.1.2 节 所 解 
释 的 ， 任 何 ASCII 文本 都 是 格式 正确 的 UTF-8， 因 此 Ascii 底层 的 Vec<u8> 可 以 直接 作为 
String 的 缓冲 区 使 用 。 


有 了 以 上 定义 ， 便 可 以 写 出 下 面 的 代码 : 


Use my_ascii::Ascii; 

















let bytes: Vec<y8> = b"ASCIIT and ye shall receive".to_ vec(); 


// 这 个 调用 不 需要 分 配 内 存 或 复制 文本 ， 只 需 一 次 扫描 
Let ascii: Ascii = Ascii::from bytes(bytes) 
unwrap(); // 我 们 知道 这 些 字 节 都 没 问 题 


// 这 个 调用 是 零 开 销 : 无 须 分 配 、 复 制 或 扫描 


let string = String::from(ascii); 














assert_eq!(string，"ASCII and ye shall receive"); 


使 用 Ascii 不 要 求 unsafe 块 。 我 们 已 经 使 用 不 安全 操作 实现 了 一 个 安全 接口 ， 而 且 是 否 满 
足 这 个 接口 的 协议 只 取决 于 模块 自己 的 代码 ， 与 用 户 的 行为 无 关 。 
Ascii 只 是 对 Vec<u8> 的 包装 ， 但 隐藏 了 模块 内 部 对 其 内 容 进 行 的 额外 检查 。 像 这 样 的 类 
型 就 叫 作 新 类 型 (newtype)， 是 Rust 中 一 种 常用 模式 。Rust 自己 的 String 类 型 实际 上 
也 是 这 样 定义 的 ， 区 别 在 于 其 内 容 被 限制 为 UTF-8， 而 不 是 ASCI。 事 实 上 ， 标 准 库 中 
String 的 定义 就 是 这 样 的 : 

pub struct String { 


vec: Vec<y8>, 


} 


在 机 器 的 层面 并 不 区 分 Rust 类 型 ， 新 类 型 及 其 元 素 在 内 存 中 拥有 相同 的 表示 ， 因 此 构建 
新 类 型 根本 不 需要 任何 机 器 指令 。 在 Ascii: :from_bytes 中 ， 表 达 式 Ascii(bytes) 对 应 的 
就 是 一 个 保存 Ascii 值 的 Vec<u8>。 类 似 地 ， 在 行内 化 之 后 ，String::from_utf8_unchecked 
可 能 不 需要 机 器 指令 ， 因 为 此 时 Vec<u8> 被 认为 是 一 个 String。 


Lm ME 这 
21.3 不 安全 的 函数 
unsafe 函数 就 是 在 普通 国 数 定 义 前 面 加 上 unsafe 关键 字 。unsafe 函数 体 自动 被 当成 unsafe 块 。 
只 能 在 unsafe 块 中 调用 unsafe 函数 。 这 意味 着 将 函数 标记 为 unsafe 会 提醒 调用 者 ， 使 用 
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这 个 函数 必须 满足 协议 要 求 才 能 避免 未 定义 行为 。 
例如 ， 下 面 是 为 前 面 的 Ascii 类 型 定义 的 一 个 新 构造 函数 ， 这 个 函数 不 管 字 节 向 量 的 内 容 
是 不 是 有 效 的 ASCII， 就 直接 基于 它 构建 Ascii: 

// 以 下 代码 必须 放 到 my_ascii 模 块 中 


impl Ascii { 


/// 基于 bytes 创 建 Ascii 值 ， 但 不 检查 bytes 中 是 否 真正 包含 格式 正确 的 ASCII 
/1// 















































/// 这 个 构造 函数 不 做 错误 处 理 ， 直 接 返 回 一 个 Ascii， 而 不 是 像 from_bytes 
/// 构造 函数 那样 返回 Result<Ascii，,NotAsciiError> 
/// 





/// # 安全 
/// 
/// 调用 者 必须 保证 bytes 只 包含 ASCII 字 符 ， 即 不 大 于 0x7f 的 字 节 


/// 否则 ， 结 果 未 定义 
pub unsafe fn from bytes_unchecked(bytes: Vec<y8>) -> Ascii { 
Ascii(bytes) 
} 
} 


这 个 函数 的 假定 是 这 样 的 : 调用 Ascii::from_bytes_unchecked 的 代码 已 经 知道 取得 的 向 
量 中 只 包含 ASCII 字符 ， 因 此 Ascii::from_bytes 坚持 要 做 的 检查 只 是 浪费 时 间 ， 调 用 
者 还 必须 为 此 编写 处 理 Err 结果 的 代码 ， 但 这 个 结果 永远 不 会 发 生 。Ascii::from_bytes_ 
unchecked 让 这 样 的 调用 者 可 以 避 开 有 效 性 检查 和 错误 处 理 。 


但 Ascii 类 型 定义 上 面 注释 的 意思 是 :“ 这 个 模块 不 允许 把 非 ASCII 字 节 保存 为 Ascii 值 。 
这 个 新 的 from_bytes_unchecked 构造 函数 真 的 能 够 做 到 这 一 点 吗 ? 


并 不 确定 。from_bytes_unchecked 的 义务 是 根据 自己 的 协议 把 这 些 字 节 传 给 调用 者 。 正 是 
这 个 协议 才 保 证 把 它 标记 为 unsafe 是 正确 的 ， 无 论 函 数 本 身 是 否 执行 了 不 安全 的 操作 ， 调 
用 者 都 必须 遵循 Rust 不 会 自动 强制 的 规则 以 避免 未 定义 行为 。 
真 的 可 以 违反 Ascii::from_bytes_unchecked 的 协议 而 导致 未 定义 行为 吗 ? 是 的 。 可 以 像 下 
面 这 样 构建 一 个 保存 格式 无 效 UTF-8 的 String: 

// 可 以 把 这 个 向 量 想象 成 是 执行 茶 个 复杂 流程 得 到 的 结果 


// 这 个 流程 本 来 应 该 产生 ASCII， 但 不 知道 哪里 出 问题 了 ! 
Let bytes = Vvec![0xf7，0xbf，09xbf，0xbf]; 





















































Let ascii = unsafe { 
// 因为 bytes 中 包含 非 ASCII 字 节 ， 所 以 违反 了 不 安全 
// 函数 的 协议 


Ascii::from bytes_unchecked(bytes) 








}; 


Let bogus: String = ascii.into(); 





// 现在 bogus 中 保存 着 格式 错误 的 UTF-8。 解 析 其 第 一 个 字符 
// 得 到 的 char 并 不 是 一 个 有 效 的 Unicode 码 点 
assert_eq!(bogus.chars().next().unwrap() as u32, Ox1fffff); 
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这 个 例子 反映 出 了 有 关 bug 和 不 安全 代码 的 两 个 重要 事实 。 


。 unsafe 块 之 前 出 现 的 bug 可 能 破坏 协议 。unsafe 块 是 否 导致 未 定义 行为 并 不 只 取决 于 
这 个 块 本 身 的 代码 ， 也 取决 于 为 它 提供 值 的 代码 。unsafe 代码 为 满足 协议 而 依赖 的 任 
何事 物 都 关系 到 安全 。 基 于 String::from_utf8_unchecked 实现 的 从 Ascii 到 String 的 
转换 只 有 在 模块 其 他 部 分 正确 维护 Ascii 不 变性 的 前 提 下 才 是 明确 定义 的 。 

。 破坏 协议 的 后 果 可 能 在 离开 unsafe 块 后 才 会 显现 。 没 有 满足 某 个 不 安全 特性 的 协议 而 
导致 的 未 定义 行为 通常 不 会 在 这 个 unsafe 块 本 身 发 生 。 像 前 面 构 建 的 这 个 “ 假 的 ”(bogus) 
字符 串 ， 可 能 要 到 程序 真正 执行 以 后 很 长 时 间 才 会 导致 问题 。 


本 质 上 ，Rust 类 型 检查 器、 借用 检查 器 和 其 他 静态 检查 机 制 在 检查 你 的 程序 时 ， 会 尝试 搜 
集 证 据 ， 证 明 它 不 会 出 现 未 定义 行为 。Rust 能 成 功 编译 你 的 程序 就 意味 着 它 找 到 了 你 的 代 
码 没 问题 的 证 据 。 但 这 个 证 明 过 程 不 包含 unsafe 块 。 因 为 unsafe 块 意味 着 你 告诉 Rust: 
“这 块 代码 没 问 题 ， 相 信 我 。” 你 的 声明 能 否 成 真 取决 于 程序 中 任何 可 能 影响 这 个 unsafe 块 
的 代码 。 而 未 能 成 真 的 后 果 可 能 会 出 现在 被 这 个 unsafe 块 影响 的 任何 地 方 。 写 下 unsafe 
关键 字 ， 就 相当 于 提醒 自己 ， 你 的 程序 不 会 全 部 享受 到 这 个 语言 安全 检查 的 好 处 。 


即使 有 这 个 选择 ， 也 应 该 尽量 创建 安全 的 接口 ， 不 创造 协议 。 这 样 会 更 简单 ， 因 为 用 户 可 
以 指望 Rust 的 安全 检查 来 保证 自己 的 代码 不 会 有 未 定义 行为 。 就 算 你 的 实现 使 用 了 不 安全 
特性 ， 最 好 还 是 使 用 Rust 的 类 型 、 生 命 期 和 模块 系统 来 请 足 它 们 的 协议 ， 同 时 只 使 用 你 自 
己 可 以 保证 的 部 分 ， 而 不 是 把 责任 推 给 你 的 调用 者 。 


可 惜 的 是 ， 未 在 文档 中 明确 解释 其 协议 的 不 安全 函数 并 不 鲜 见 。 这 就 要 求 使 用 者 凭借 自己 
的 经 验 和 对 代码 行为 的 认 知 自行 推断 规则 。 如 果 你 有 过 使 用 C 或 C++ API 时 那 种 内 心 不 安 
的 经 历 ， 那 么 应 该 就 能 体会 这 种 心情 。 


21.4 不 安全 的 块 还 是 不 安全 的 函数 


有 时 候 ， 你 可 能 不 知道 自己 到 底 该 使 用 unsafe 块 还 是 该 直接 把 函数 都 标记 为 unsafe。 建 

议 你 首先 考虑 函数 。 

。 如 果 会 以 编译 通过 但 仍 导 致 示 定义 行为 的 方式 误 用 函数 ， 则 必须 将 其 标记 为 不 安全 。 正 
确 使 用 函数 的 规则 是 它 的 协议 ， 协 议 的 存在 是 函数 不 安全 的 根本 。 

。 如 果 不 会 , 那 函数 就 是 安全 的 。 换 句 话 说 , 只 要 类 型 正确 的 调用 都 不 会 导致 未 定义 行为 。 
这 个 函数 就 不 应 试 标记 为 unsafe。 

函数 是 否 安全 与 函数 体内 是 否 使 用 不 安全 特性 无 关 。 真 正 决定 函数 安全 与 否 的 是 有 无 协 

议 。 前 面 已 经 展示 了 一 个 没有 使 用 不 安全 特性 的 不 安全 函数 ， 以 及 一 个 使 用 了 不 安全 特性 

的 安全 函数 。 

不 要 只 因为 函数 体内 使 用 了 不 安全 特性 就 把 安全 的 函数 标记 为 unsafe。 这 样 会 导致 函数 更 

难 使 用 ， 让 人 (自然 ) 想 去 寻找 在 哪里 可 以 看 到 有 关 其 协议 的 解释 。 这 时 候 要 使 用 unsafe 

块 ， 即 使 整个 函数 只 有 这 一 个 块 。 
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IE AM ZX 一 
21.5 未 定义 行为 
本 章 开 头 说 过 ， 未 定义 行为 是 指 “Rust 坚决 认为 你 的 代码 永远 不 会 出 现 的 行为 ”。 这 和 句 话 
的 措辞 有 点 奇怪 ， 特 别 是 根据 我 们 使 用 其 他 语言 的 经 验 ， 知 道 这 些 行 为 确实 会 以 其 种 频率 
出 现 。 为 什么 这 个 概念 对 界定 不 安全 代码 的 责任 有 帮助 ? 


编译 器 是 一 个 将 一 种 语言 翻译 为 男 一 种 语言 的 翻译 器 。Rust 编译 器 将 Rust 程序 翻译 为 等 
价 的 机 器 语言 程序 。 但 是 说 两 种 以 完全 不 同 语言 表示 的 程序 等 价 ， 这 意味 着 什么 呢 ? 
所 幸 的 是 ， 这 个 问题 对 程序 员 而 言 比 对 语言 学 家 更 容易 理解 。 我 们 通常 所 说 的 两 个 程序 等 
价 ， 意 味 着 它们 在 执行 时 会 表现 出 相同 的 行为 。 比 如 会 触发 相同 的 系统 调用 、 以 相同 的 方 
式 与 外 部 库 交 互 ， 等 等 。 这 有 点 像 对 程序 进行 图 灵 测 试 : 如 果 你 无 法 分 辩 自 己 是 在 跟 原 始 
版 还 古 翻译 版 交流 ， 那 它们 就 是 等 价 的 。 
现在 来 看 看 这 段 代码 : 

let i = 10; 

very_trustworthy(&i); 

println!("{}", i * 100); 
即使 不 知道 very_trustworthy 的 定义 ， 也 可 以 看 出 它 只 接收 一 个 对 的 共享 引用 ， 因 此 这 
个 调用 不 会 改变 i 的 值 。 因 为 传 给 println! 的 值 始终 都 是 1000， 所 以 Rust 在 把 这 段 代码 
翻译 成 机 器 语言 时 ， 可 以 就 当 它 是 这 么 写 的 : 

very_trustworthy(&10); 

println!("{}", 1000); 


这 个 变换 之 后 的 版 本 与 原始 版 具有 相同 的 可 见 行为 ， 但 可 能 稍微 快 一 点 。 不 过 只 有 在 保证 
它 与 原始 版 具有 相同 含义 的 前 提 下 谈论 性 能 才 是 有 意义 的 。 如 果 very_trustworthy 的 定义 
是 下 面 这 样 呢 ? 


fn very_trustworthy(shared: &i32) { 
unsafe { 
// 把 共享 引用 转换 为 一 个 可 修改 指针 
// 这 是 一 个 未 定义 行为 
Let mutable = shared as *const i32 as *mut i32; 
*mutable = 20; 






























































} 
} 


这 段 代 码 突破 了 共享 引用 的 规则 ， 它 把 i 的 值 修改 为 20， 即 使 这 个 值 应 该 被 冻结 ， 因 为 
i 是 借 来 共享 的 。 结 果 ， 我 们 在 调用 代码 中 所 做 的 变换 就 有 了 不 同 的 可 见效 果 。 如 果 Rust 
变换 代码 ， 程 序 就 打印 1000; 如果 不 做 任何 变换 并 使 用 i 的 新 值 ， 程 序 就 打印 2000。 在 
very_trustworthy 中 突破 共享 引用 的 规则 意味 着 共享 引用 的 行为 在 调用 代码 中 不 会 再 像 预 
期 那样 了 。 

Rust 可 能 会 执行 的 任何 变换 都 有 这 个 问题 。 即 便 把 一 个 函数 行内 化 到 调用 它 的 地 方 ， 也 会 
假设 在 被 调用 代码 完成 时 ， 控 制 流 会 返回 调用 的 地 方 。( 先 不 说 其 他 假设 。) 但 本 章 一 开始 
就 给 出 了 一 个 违背 这 个 假设 ， 从 而 导致 行为 异常 的 例子 。 
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对 Rust (或 者 任何 其 他 语言 ) 来 说 ， 要 评估 对 程序 的 变换 是 否 保留 了 其 含义 基本 上 是 不 可 
能 的 ， 除 非 它 可 以 信任 这 门 语言 的 基本 特性 具有 预定 义 的 行为 。 而 到 底 这 些 特性 是 否 具 有 
预定 义 行 为 ， 不 仅 取决 于 手边 的 代码 ， 还 取决 于 程序 中 那些 你 看 不 到 的 部 分 。 为 了 可 以 对 
你 的 代码 做 任何 处 理 ，Rust 必须 假设 你 程序 的 其 他 部 分 都 是 行为 正常 的 。 
以 下 是 Rust 评判 程序 行为 是 否 正常 的 标准 。 
。 程序 必须 不 读 取 未 初始 化 的 内 存 。 
。 程序 必须 不 创建 无 效 的 原始 值 。 
一 引用 或 装 箱 的 值 是 nutLL 
一 _bool 值 不 是 0 或 1 
一 _enun 值 包含 无 效 判 别 式 (discriminant) 值 
一 _char 值 包含 无 效 或 代理 对 Unicode 码 点 
一 str 值 包含 格式 不 正确 的 UTF-8 
。 程序 必须 遵守 第 $ 章 解释 的 关于 引用 的 规则 。 引 用 生命 期 不 能 超过 其 引用 目标 的 生命 期 ， 
共享 访问 是 只 读 访问 ， 可 修改 访问 是 专 有 (排他 ) 访问 。 
。 程序 必须 不 对 空 指 针 、 未 正确 对 齐 的 指针 或 悬空 指针 解 引 用 。 
。 程序 必须 不 使 用 指针 访问 与 该 指针 关联 的 分 配 内 存 区 域 之 外 的 内 存 。21.7.1 节 将 详细 解 
释 这 条 规则 。 
。 程序 必须 没有 数据 争 用 。 两 个 线程 在 访问 没有 同步 的 同一 块 内 存 且 至 少 一 个 访问 是 写 的 
情况 下 会 发 生 数 据 争 用 。 
。 程序 必须 不 在 另 一 种 语言 (通过 外 来 函数 接口 执行 ) 的 调用 期 间 展 开 ， 正 如 7.1.1 节 所 
解释 的 那样 。 
。 程序 必须 遵守 标准 库 函 数 的 协议 。 
这 些 规则 都 是 Rust 在 优化 你 的 程序 并 将 其 翻译 成 机 器 语言 时 假设 成 立 的 。 简 单 来 说 ， 未 定 
义 行 为 就 是 指 任何 违反 上 述 规则 的 行为 。 这 也 是 我 们 会 说 Rust 坚决 认为 你 的 代码 永远 不 会 
出 现 未 定义 行为 的 原因 。 如 果 想 要 得 出 编译 后 的 程序 是 对 源 代码 忠实 翻译 的 结论 ， 这 个 假 
设 就 是 必要 的 。 
未 使 用 不 安全 特性 的 Rust 代码 只 要 编译 通过 ， 就 一 定 会 遵守 前 面 的 所 有 规则 。 只 有 在 使 用 
不 安全 特性 时 ， 贯 彻 这 些 规则 才 会 成 为 你 的 责任 。 在 C 和 C++ 中 ， 你 的 程序 可 以 没有 任 
何 错误 或 警告 地 编译 通过 说 明 不 了 什么 。 正 如 本 书 前 面 所 提 到 的 ， 即 使 那些 因为 广 受 赞誉 
的 项 目 而 青史 留 名 的 最 优秀 的 C 和 C++ 程序 员 ， 他 们 写 的 那些 高 水 平 的 代码 在 实践 中 照 
样 会 出 现 未 定义 行为 。 


21.6 不 安全 的 特 型 


不 安全 的 特 型 指 的 是 有 Rust 不 能 检查 或 强制 的 协议 ， 实 现 者 必须 满足 这 些 协议 才能 避免 未 
定义 行为 的 特 型 。 要 实现 不 安全 特 型 ， 必 须 将 实现 标记 为 unsafe。 理 解 特 型 的 协议 并 让 你 
的 类 型 满足 该 协议 是 你 的 责任 。 

通常 ， 将 其 类 型 变量 与 不 安全 特 型 绑 定 的 函数 自身 也 会 使 用 不 安全 特性 ， 而 满足 它们 的 协议 
只 能 依赖 于 不 安全 特 型 的 协议 。 对 这 个 特 型 不 正确 的 实现 可 能 导致 这 个 函数 出 现 示 定义 行为 。 
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不 安全 特 型 的 经 典 例 子 是 std: :marker::Send 和 std::marker::Sync。 这 两 个 特 型 没有 定义 
任何 方法 ， 因 此 你 可 以 用 自己 喜欢 的 任何 类 型 轻松 实现 它们 。 但 是 它们 有 协议 : Send 要 求 
实现 者 可 以 安全 地 转移 到 另 一 个 线程 ， 而 Sync 要 求实 现 者 可 以 安全 地 通过 共享 引用 在 线程 
间 共 享 。 给 不 适当 的 类 型 实现 send， 可 能 会 导致 比如 std: :sync::Mutex 不 再 安全 ， 从 而 无 
法 避免 数据 和 争 用 。 

举 一 个 例子 ，Rust 标准 库 中 包含 一 个 不 安全 特 型 core: :nonzero: :Zeroable。 这 个 特 型 用 于 
让 类 型 通过 将 它们 的 所 有 字 节 设置 为 0 来 实现 安全 初始 化 。 很 明显 ，usize 类 型 都 是 0 没 
问题 ， 但 全 为 0 的 8&T 就 是 一 个 空 引用 ， 一 旦 解 引 用 就 会 造成 崩 误 。 对 于 可 以 用 0 初始 化 
的 类 型 ， 还 可 以 应 用 一 些 优化 ， 比 如 可 以 使 用 std: :mem: :write_bytes (memset 在 Rust 中 
的 等 价 特性 ) 快速 初始 化 这 种 类 型 的 数组 ， 或 者 使 用 分 配 0 填充 页 的 操作 系统 调用 。( 到 
Rust 1.17 为 止 ，Zeroable 还 是 实验 性 的 ， 因 此 其 可 能 会 在 未 来 的 Rust 版 本 中 被 修改 或 删 
除 。 不 过 它 是 一 个 简单 、 合 适 、 真 实 的 例子 。) 


Zeroable 是 一 个 典型 的 标记 特 型 (marker trait) ， 没 有 方法 和 关联 类 型 ; 
pub unsafe trait Zeroable {} 
相应 类 型 对 它 的 实现 也 同样 简单 明了 : 


unsafe impl Zeroable for u8 {} 
unsafe impl Zeroable for i32 {} 
unsafe impl Zeroable for usize {} 


// 还 有 剩 下 的 其 他 整数 类 型 


有 了 这 些 定义 ， 就 可 以 写 一 个 函数 ， 让 它 快速 分 配 一 个 指定 长 度 的 向 量 ， 包 含 zeroable 类 
型 的 值 ; 


#![feature(nonzero)] // 许可 Zeroable 























extern crate core; 
use core::nonzero::Zeroable; 


fn zeroed _ vector<T>(len: usize) -> Vec<T> 
where T: Zeroable 


{ 
Let mut vec = Vec::with capacity(len); 
unsafe { 
std: :ptr::write_ bytes(vec.as_mut ptr(), 0, len); 
vec.set_len(len); 
} 
vec 
} 


这 个 函数 先 创建 了 一 个 包含 所 需 容量 的 空 vec， 然 后 调用 write_bytes 将 未 占用 的 缓冲 区 
填 上 0。(write_bytes 函数 将 Len 理解 为 T 元 素 的 数量 ， 而 非 字 节 数 ， 因 此 这 个 调用 会 填 
满 整个 缓冲 区 。) 向 量 的 set_len 方法 只 会 修改 其 长 度 ， 不 会 对 缓冲 区 做 任何 事情 。 这 是 
不 安全 的 ， 因 为 必须 保证 新 的 缓冲 区 实际 包含 类 型 T 适 当初 始 化 的 值 。 不 过 这 正 是 绑 定 T: 
Zeroable 所 保证 的 : 以 0 填充 的 一 堆 字 市 表示 一 个 有 效 的 T 值 。 我 们 对 set_len 的 使 用 是 
安全 的 。 
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接 下 来 使 用 这 个 函数 : 


let Vv: Vec<usize> = zeroed_ vector(100 000); 
assert!(v.iter().all(|&u| yu == 0)); 


显然 ，Zeroable 一 定 是 不 安全 特 型 ， 因 为 不 遵守 其 协议 的 实现 可 能 导致 未 定义 行为 : 


struct HoLdsRef< 'a>(&'a mut i32); 





unsafe impL<'a> Zeroable for HoLdsRef<'a> { } 


Let mut Vv: Vec<HoldsRef> = zeroed_vector(1); 

*v[9].9 = 1;  // 崩溃 : 解 引用 空 指针 
Rust 会 毫 无 怨言 地 编译 这 段 代 码 ， 它 对 Zeroable 要 表示 什么 没有 想法 ， 因 此 也 不 知道 它 什 
么 时 候 会 在 不 适当 的 类 型 上 实现 。 与 其 他 不 安全 特性 一 样 ， 理 解 并 遵守 不 安全 特 型 的 协议 
是 你 的 责任 。 
注意 ， 不 安全 代码 不 能 依赖 普通 、 安 全 特 型 的 正确 实现 。 假 设 有 一 个 std: :hash: :Hasher 
特 型 的 实现 ， 它 简单 地 返回 一 个 随机 散 列 值 ， 与 用 来 计算 散 列 的 值 无 关 。 这 个 特 型 要 求 对 
同一 个 位 进行 两 次 散 列 运算 必须 产生 相同 的 散 列 值 。 但 这 个 实现 不 满足 这 个 要 求 ， 这 绝对 
是 错误 的 。 但 因为 Hasher 并 非 不 安全 特 型 ， 不 安全 代码 在 使 用 这 个 散 列 器 时 必须 不 能 出 现 
未 定义 行为 。std: :collections::HashMap 类 型 认真 遵守 了 它 所 使 用 的 不 安全 特性 的 协议 ， 
而 没有 考虑 散 列 器 的 行为 。 可 以 肯定 ， 这 个 散 列 表 不 能 正确 运行 :查询 会 失败 ， 条 目 也 会 
随机 出 现 和 消失 。 但 这 个 表 不 会 出 现 未 定义 行为 。 


21.7 原始 指针 


Rust 中 的 原始 指针 是 一 种 不 受 约束 的 指针 。 使 用 原始 指针 可 以 创建 Rust 检查 的 指针 类 型 
所 不 能 创建 的 任何 结构 ， 比 如 双向 链表 或 任意 对 象 的 图 。 但 由 于 原始 指针 过 于 灵活 ，Rust 
无 法 判断 你 是 否 在 安全 地 使 用 它们 ， 因 此 只 能 在 unsafe 块 中 对 它们 解 引 用 。 


原始 指针 本 质 上 等 价 于 C 或 C++ 指针 ， 因 此 也 常用 于 操作 这 些 语言 编写 的 代码 。 
有 两 种 原始 指针 : 


*mut T 是 一 个 指向 T 且 允许 修改 其 引用 目标 的 原始 指针 ，; 
*const T 是 一 个 指向 T 但 只 允许 读 取 其 引用 目标 的 原始 指针 。 


(没有 简单 的 * 了 类型， 必须 始终 指定 const 或 mut。) 
可 以 把 引用 转换 为 原始 指针 ， 然 后 使 用 * 操作 符 对 其 解 引 用 : 


let mut x = 10; 
let ptr_ x = &mut x as *mut i32; 
























































let y = Box::new(20); 
let ptr_y = &*y as *const i32; 


unsafe { 
*ptr_x += *ptr_y; 
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} 


assert eq!(x, 30); 
与 装 箱 和 引用 不 同 ， 原 始 指针 可 以 是 空 的 ， 类似 C 中 的 NJLL 或 C++ 中 的 nuLLptr: 


fn option_ to_raw<T>(opt: Option<&T>) -> *const T { 
match opt { 
None => std::ptr::null(), 
Some(r) => r as *const T 


} 
} 


assert!(!option_ to_raw(Some(&("pea", "pod"))).is_ null()); 
assert_ eq!(option to_raw::<i32>(None), std::ptr::null()); 

这 个 例子 中 没有 unsafe 块 ， 因 为 创建 原始 指针 、 传 递 原始 指针 ， 以 及 比较 原始 指针 都 是 安 

全 的 。 只 有 解 引 用 原始 指针 是 不 安全 的 。 

指向 非 固 定 大 小 类 型 的 原始 指针 是 一 个 胖 指 针 ， 就 像 对 应 的 引用 或 Box 类 型 一 样 。*const 

[u8] 指针 包含 长 度 和 地 址 ， 类 似 *mut std: :io: :Write 这 样 特 型 对 象 的 指针 则 带 有 一 个 虚 

拟 表 。 

Rust 虽然 会 在 各 种 情况 下 隐 式 解 引 用 安全 指针 类 型 ， 但 原始 指针 必须 显 式 解 引用 。 

。 操作 符 . 不 会 隐 式 解 引 用 原始 指针 ， 必 须 写 成 (*raw) .field 或 (*raw).method(...)。 

。 原始 指针 没有 实现 Deref， 因 此 Deref 转换 不 适合 它们 。 

。 操作 符 == 和 < 等 比较 原始 指针 的 地 址 ， 即 如 果 两 个 原始 指针 指向 内 存 中 的 相同 位 置 那 
它们 就 相等 。 类 似 地 ， 对 原始 指针 计算 散 列 值 ， 是 对 其 指向 的 地 址 而 非 引 用 目标 计算 散 
列 值 。 

。 格式 化 特 型 std::fmt::Display 等 会 自动 跟随 引用 ， 但 它们 根本 不 处 理 原始 指针 。 
std: :fmt::Debug 和 std::fmt::Pointer 例外 ， 它 们 显示 原始 指针 的 十 六 进 制 地 址 ， 但 不 
会 对 它们 解 引 用 。 

与 C 和 C++ 中 的 + 操作 符 不 同 ，Rust 的 + 操作 符 不 处 理 原 始 指针 。 不 过 ， 你 可 以 通过 原 

始 指针 的 offset 和 wrapping_offset 方法 实现 指针 算术 。 没 有 像 C 和 C++ 中 的 - 操作 符 那 

样 的 返回 两 个 指针 距离 的 标准 方法 ， 不过， 你 可 以 自己 写 一 个 : 


fn distance<T>(left: *const T, right: *const T) -> isize { 
(left as isize - right as isize) / std::mem::size of::<T>() as isize 















































} 


let trucks = vec!["garbage truck", "dump truck", "moonstruck"]; 
Let first = &trucks[0]; 

Let Last = &trucks[2]; 

assert eq!(distance(last, first), 2); 

assert eq!(distance(first, last), -2); 


即使 distance 的 参数 是 原始 指针 ， 我 们 也 可 以 把 引用 传 给 它 。Rust 会 隐 式 地 将 引用 转换 为 
原始 指针 (当然 ， 不 会 反 向 转换 )。 


Rust 的 as 操作 符 可 以 将 引用 转换 为 原始 指针 ， 或 者 将 一 种 原始 指针 转换 为 另 一 种 原始 指 
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针 ， 只 要 看 起 来 有 可 能 ， 几 乎 都 疫 问 题 。 不 过 ， 可 能 需要 将 一 个 复杂 的 转换 分 成 几 个 简单 
的 步骤 。 比 如 : 

&vec![42_u8] as *const String // 错误 : 无 效 转换 

&vec![42_u8] as *const Vec<u8> as *const String; // 可 以 转换 
注意 ，as 操作 符 不 能 把 原始 指针 转换 为 引用 。 这 种 转换 不 安全 ，as 只 能 用 于 安全 操作 。 为 
此 ， 必 须 先 (在 unsafe 块 中 ) 对 原始 指针 解 引 用 ， 然 后 再 借用 得 到 的 值 。 


这 样 操 作 时 一 定 要 小 心 。 以 这 种 方式 产生 的 引用 有 具有 不 受 限 的 生命 期 ， 也 就 是 说 它 能 
“ 活 ” 多 长 时 间 没 有 限制 ， 因 为 原始 指针 不 会 给 Rust 做 这 种 决定 的 参照 。 本 章 后 面 的 
21.8.5 方 将 展示 儿 个 适当 限制 生命 期 的 例子 。 


很 多 类 型 有 as_ptr 和 as_mut_ptr 方法 ， 它 们 返回 指向 其 内 容 的 原始 指针 。 例 如 ， 数 组 切 
片 和 字符 串 返 回 的 指针 指向 它们 的 第 一 个 元 素 ， 而 有 些 迭 代 器 返回 的 指针 会 指向 它们 产生 
的 下 一 个 元 素 。 像 Box、Rc 和 Arc 这 样 的 所 有 型 指针 类 型 有 into_raw 和 from_raw 函数 ， 可 
以 实现 与 原始 指针 之 间 的 相互 转换 ， 其 中 某 些 方法 的 协议 会 有 一 些 出 人 意料 的 要 求 ， 因 此 
在 使 用 之 前 最 好 先 查 看 一 下 它们 的 文档 。 


我 们 也 可 以 把 整数 转换 为 原始 指针 ， 虽 然 唯一 可 以 信任 的 整数 是 那些 原本 就 源 自 指针 的 整 
数 。21.7.2 市 将 展示 一 个 这 样 使 用 原始 指针 的 例子 。 


与 引用 不 同 ， 原 始 指 针 既 不 是 Send 也 不 是 Sync。 因 此 ， 任 何 包含 原始 指针 的 类 型 默认 都 

“会 实现 这 两 个 特 型 。 跨 线程 发 送 或 共享 原始 指针 不 存在 固有 的 不 安全 性 。 毕 竞 无 论 它们 
跑 到 哪里 ， 你 都 需要 在 一 个 unsafe 块 中 解 引用 它们 。 但 考虑 到 原始 指针 通常 所 扮演 的 角 
色 ， 这 门 语 言 的 设计 者 认为 这 种 行为 最 好 是 默认 的 。 前 面 21.6 节 已 经 讨论 过 如 何 实现 Send 
和 Sync 了 。 


21.7.1 安全 解 引 用 原始 指针 
以 下 是 安全 使 用 原始 指针 的 一 些 常 识 性 提示 。 


。 解 引 用 空 指针 或 悬空 指针 是 未 定义 行为 ， 与 引用 未 初始 化 内 存 或 离开 作用 域 的 值 一 样 。 

。 解 引 用 没有 与 它们 引用 目标 类 型 正确 对 齐 的 指针 是 未 定义 行为 。 

。 如 果 想 从 解 引 用 后 的 原始 指针 中 借用 值 ， 必 须 遵守 第 5 章 讲解 的 引用 安全 规则 : 引用 不 应 
该 “ 活 ” 得 比 它们 的 引用 目标 还 长 ， 共 享 引 用 是 只 读 访问 ， 可 修改 引用 是 专 有 访问 。( 这 个 
规则 很 容易 意外 违反 ， 因 为 原始 指针 经 常用 于 创建 包含 非 标准 共享 或 所 有 权 的 数据 结构 。) 

。 如 果 想 使 用 原始 指针 的 引用 目标 ， 必 须 保证 它 是 该 类 型 格式 正确 的 值 。 例 如 ， 必 须 确 保 

解 引 用 *const char 以 后 得 到 的 是 一 个 正确 的 、 非 代理 对 Unicode 码 点 。 

。 如 果 想 在 原始 指针 上 使 用 offset 和 wrapping_offset 方法 ， 必 须 保 证 指针 只 指向 变量 或 

原来 指针 所 指向 的 堆 内 存 块 中 的 字 节 ， 或 者 指向 这 个 范围 后 面 的 第 一 个 字 节 。 

如 果 要 做 指针 算术 ， 把 原始 指针 转换 为 整数 ， 用 整数 来 做 计算 ， 再 把 计算 结果 转换 为 指 

针 ， 那 么 结果 指针 必须 是 offset 方法 的 规则 允许 产生 的 。 

。 如 果 要 给 原始 指针 的 引用 目标 赋值 , 则 必须 不 能 违反 引用 目标 所 在 类 型 的 不 变性 。 例 如 ， 
要 是 你 有 一 个 *mut u8 指向 某 个 String 的 一 个 字 节 ， 那 么 在 这 个 u8 中 存储 的 值 必须 保 
证 该 String 持 有 格式 正确 的 UTF-8。 
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除了 借用 规则 ， 这 些 本 质 上 都 是 在 使 用 C 或 C++ 指针 时 必须 遵循 的 规则 。 

不 违反 类 型 不 变性 的 原因 应 该 说 清楚 。 很 多 Rust 标准 类 型 在 自己 的 实现 中 使 用 不 安全 代 
码 ， 但 仍然 提供 安全 接口 ， 假 定 它们 可 以 通过 Rust 的 安全 检查 ， 并 遵守 其 模块 系统 和 可 见 
性 规则 。 使 用 原始 指针 绕 过 这 些 保护 措施 可 能 导致 未 定义 行为 。 

原始 指针 完整 、 准 确 的 协议 并 不 容易 说 清楚 ， 而 且 还 会 随 着 语言 的 发 展 而 改变 。 但 这 里 概 
述 的 原理 对 保证 代码 的 安全 性 还 是 适用 的 。 


























21.7.2 示例 : RefwithFlag 


下 面 这 个 例子 使 用 原始 指针 实现 了 经 典 的 "位 级 黑 科 技 ,并 将 其 包装 为 一 个 彻底 安全 的 Rust 
类 型 。 这 个 模块 定义 了 一 个 类 型 ， 即 RefWithFlag<'a，T>， 它 保存 着 一 个 &'a T 和 一 个 
bool， 类 似 于 元 组 (&'a T，bool)， 但 仍然 只 设法 占用 一 个 机 器 字 ， 而 不 是 两 个 。 这 种 技术 
经 常用 于 垃圾 收集 器 和 虚拟 机 的 实现 ， 其 中 某 些 类 型 (比如 表示 对 象 的 类 型 ) 因为 实在 太 
多 ， 结 果 就 算 只 给 每 个 值 增加 一 个 字 都 会 明显 增加 内 存 占 用 。 

mod ref_with_fLag { 


use std::marker::PhantomData; 
use std::mem::align_of; 























/// 包装 在 一 个 字 中 的 &T 和 bool 
/// 类 型 T 必 须要 求 至 少 二 字 节 对 章 
/// 
/// 作为 程序 员 ， 如 果 你 还 从 未 遇 到 过 一 个 不 想 偷 走 的 2" 位 的 指针 ， 
/// 那 你 现在 可 以 安全 地 这 样 做 了 ! (“不 过 这 样 就 没 那 么 刺激 了 …… ”) 
pub struct RefWithFlag<'a, T: 'a> { 
ptr_and_bit: usize, 
behaves_like: PhantomData<&'a T> // 不 占 空间 
} 


impl<'a, T: 'a> RefWithFlag<'a, T> { 
pub fn new(ptr: &'a T, flag: booL) -> RefWithFlag<T> { 
assert!(align of::<T>() % 2 == 0); 
RefWwithFlag { 
ptr_and_bit: ptr as *const T as usize | flag as usize, 
behaves_like: PhantomData 


} 
} 
pub fn get_ref(&seLf) -> &'aTL{ 
unsafe { 
let ptr = (self.ptr_and_bit & !1) as *const T; 
&*ptr 
} 


} 


pub fn get flag(&self) -> bool { 
self.ptr_and bit & 1 != 0 




















注 1: 好 吧 ， 应 该 说 是 成 就 我 们 的 经 
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} 
} 
} 


以 上 代码 利用 了 很 多 类 型 在 内 存 中 必须 放 在 偶数 地 址 的 事实 。 因 为 偶数 地 址 的 最 低 有 效 位 
始终 为 0， 所 以 可 以 在 那里 存 点 别 的 ， 然 后 只 要 对 最 低位 应 用 掩 码 就 能 可 靠 地 重建 原始 地 
址 。 但 并 不 是 所 有 类 型 都 可 以 ， 比 如 类 型 ug 和 (bool，[i8; 2]) 可 以 放 在 任意 地 址 。 但 我 
们 可 以 在 构造 时 检查 类 型 的 对 齐 ， 拒 绝 不 合适 的 类 型 。 

可 以 像 这 样 使 用 RefWithFlag: 


use ref_with flag::RefWithFlag; 














let vec = vec![10, 20, 30]; 

let flagged = RefWithFlag::new(&vec, true); 

assert_eq!(flagged.get_ref()[1], 20); 

assert_eq!(flagged.get flag(), true); 
构造 函数 RefWithFlag: :new 接收 一 个 引用 和 一 个 bool 值 ， 保 证 该 引用 的 类 型 是 合适 的 ， 
然后 把 引用 转换 为 一 个 原始 指针 ， 再 转换 为 一 个 usize。usize 类 型 的 大 小 足以 容纳 作为 编 
译 目 标的 任何 处 理 器 下 的 指针 ， 因 此 把 原始 指针 转换 为 usize 再 转换 回来 是 定义 明确 的 。 
得 到 usize 之 后 ， 我 们 知道 它 一 定 是 偶数 ， 因 此 可 以 使 用 按 位 或 操作 符 | 将 它 与 bool 组 
合 ， 而 这 个 bool 已 经 被 转换 成 了 整数 0 或 1。 
get_flag 方法 用 于 提取 RefWwithFlag 的 bool 组 件 。 很 简单 ， 只 要 对 最 低位 应 用 掩 码 并 检查 
它 是 否 非 零 即 可 。 


get_ref 方法 用 于 从 RefwithFlag 中 提取 引用 。 首 先 ， 对 这 个 usize 的 最 低位 应 用 掩 码 并 
将 其 转换 为 一 个 原始 指针 。as 操作 符 不 会 将 原始 指针 转换 为 引用 ， 但 我 们 可 以 解 引 用 这 
个 原始 指针 (当然 是 在 unsafe 块 中 )， 然 后 再 借用 它 。 借 用 原始 指针 的 引用 目标 会 得 到 
一 个 生命 期 无 限 长 的 引用 。Rust 会 赋予 引用 一 个 满足 其 周围 代码 要 求 的 生命 期 (如 果 有 
的 话 )。 不 过 ， 通 常会 有 一 些 比较 明确 的 生命 期 ， 这 些 生命 期 过 于 精确 ， 因 而 会 磁 到 更 多 
错误 。 在 这 个 例子 中 ，get_ref 的 返回 类 型 是 &'a T。Rust 推断 这 个 引用 的 生命 期 一 定 是 
RefwithFlag: :new 的 参数 ， 这 正 是 我 们 想 要 的 ， 因 为 这 个 生命 期 就 是 原本 引用 的 生命 期 。 


在 内 存 中 ,RefWithFlag 看 起 来 就 是 一 个 usize。 因 为 PhantomData 是 一 个 没有 大 小 的 (zero- 
sized) 类 型 ，behaves_like 字段 在 这 个 结构 体 中 不 占 空间 。 但 这 个 PhantomData 是 必要 的 ， 
因为 在 使 用 RefwithFlag 的 代码 中 ，Rust 要 通过 它 才 能 知道 如 何 处 理 生 命 期 。 想 象 一 下 这 
个 类 型 没有 behaves_like 字段 的 样子 : 

// 这 样 不 会 编译 

pub struct RefWithFlag<'a, T: 'a> { 


ptr_and_bit: usize 


} 


第 5 章 曾 指出 过 ,任何 包含 引用 的 结构 体 必须 不 能 “ 活 ” 得 比 它们 借用 的 值 还 要 长 ， 以 
免 引 用 变 成 荆 空 指针 。 这 个 结构 体 必须 遵守 应 用 到 其 字段 的 限制 。 这 个 限制 当然 也 会 应 
用 到 RefwithFlag。 在 刚刚 看 到 的 示例 代码 中 ，flagged 必须 不 能 比 vec“ 长 寿 "， 因 为 
flagged.get_ref() 返回 一 个 对 它 的 引用 。 但 这 里 精简 后 的 RefwithFlag 类 型 根本 不 包含 
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引用 ， 永 远 不 会 使 用 它 的 生命 期 参数 'a， 它 就 是 一 个 usize。Rust 如 何 才能 知道 ptr_and_ 
bit 有 合适 的 生命 期 呢 ?” 包 含 一 个 PhantomData<&'a T> 字段 就 是 为 了 告诉 Rust， 让 它 视 同 
RefWithFlag<'a,，T> 就 包含 一 个 &'a T。 而 且 这 样 实际 也 不 影响 这 个 结构 体 的 表现 。 

尽管 Rust 并 不 真 的 知道 发 生 了 什么 (这 也 是 RefwithFlag 不 安全 的 原因 )， 但 它 会 尽力 帮 
你 处 理 生 命 期 。 如 果 省 略 这 个 behaves_like 字段 ，Rust 则 会 抱怨 参数 中 的 'a 和 T 没 有 被 
使 用 ， 并 建议 使 用 一 个 PhantomData。 

RefWithFLag 使 用 了 与 前 面 展 示 的 Ascii 类 型 一 样 的 策略 来 避免 其 unsafe 块 的 未 定义 行为 。 
这 个 类 型 本 身 是 pub 的 ， 但 其 字段 不 是 ， 意 味 着 只 有 ref_with_flag 模块 中 的 代码 可 以 创 
建 或 查看 RefwithFlag 的 值 。 不 用 看 太 多 代码 就 可 以 确定 ptr_and_bit 字段 是 结构 严谨 的 。 


21.7.3 ”可 空 指针 


Rust 中 的 空 原始 指 针 是 一 个 零 地 址 ， 与 C 和 C++ 中 一 样 。 对 任意 类 型 T，std: :ptr ::nuLL<T> 
函数 返回 一 个 *const T 空 指针 ， 而 std::ptr::nuLL_mut<T> 返回 一 个 *mut T 空 指针 。 


检查 一 个 原始 指针 是 否 为 空 有 几 种 方法 。 最 简单 的 是 使 用 is_nulL 方法 ， 但 使 用 as_ref 方 
法 可 能 更 方便 。 后 者 以 一 个 *const T 指针 为 参数 ， 返 回 一 个 0ption<&'a T>， 空 指针 会 被 
转换 为 None。 类 似 地 ，as_mut 方法 把 *mut T 指针 转换 为 0ption<&'a mut T> 值 。 


21.7.4 类 型 大 小 与 对 齐 

任何 Sized 类 型 的 值 在 内 存 中 都 会 占用 固定 数量 的 字 节 ， 而 且 必 须 放 到 一 个 是 某 个 对 齐 
(alignment) 值 倍数 的 地 址 上， 对 章 值 由 机 器 架构 决定 。 例 如 ，(i32，i32) 元 组 占用 8 字 
节 ， 而 大 多 数 处 理 器 倾向 于 将 它 放 在 一 个 是 4 的 倍数 的 地 址 。 


调用 std: :mem: :size_of::<T>() 返回 类 型 T 值 的 大 小 ， 以 字 节 为 单位 。 而 调用 std: :mem 
::aLign_of::<T>() 返回 类 型 T 要求 的 对 齐 值 。 例 如 : 


assert eq!(std::mem::size of::<i64>(), 8); 
assert eq!(std::mem::align_of::<(i32, i32)>(), 4); 


任何 类 型 的 对 齐 值 都 是 2 的 需 。 
即使 技术 上 可 以 占用 更 少 的 空间 ， 类 型 的 大 小 也 总 是 会 四 舍 五 入 到 其 对 齐 值 的 倍数 。 例 
如 ， 尽 管 元 组 (f32，u8) 只 占用 5 字 节 ， 但 size_of::<(f32，u8)>() 依然 返回 8， 因 为 
align_of::<(f32，u8)>() 是 4。 这 样 可 以 确保 如 果 你 有 一 个 数组 ， 其 元 素 类 型 的 大 小 始终 
应 于 两 个 元 素 的 距离 。 
对 于 无 固定 大 小 的 类 型 ， 其 大 小 和 对 齐 取决 于 当前 值 。 对 于 一 个 无 固定 大 小 值 的 引用 ， 
std: :mem: :size_of_val 和 std: :mem: :align_of_val 国 数 返 回 这 个 值 的 大 小 和 对 章 值 。 这 两 
个 函数 可 用 于 Sized 和 非 固定 大 小 类 型 的 引用 。 

// 指向 切片 的 胖 指 针 包 含 其 引用 目标 的 长 度 


Let slice: 8&[i32] = &[1，3，9，27，81]; 
assert eq!(std::mem::size of val(slice), 20); 
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let text: &str = "alligator"; 
assert_ eq!(std::mem::size of_val(text), 9); 


use std::fmt::Display; 
Let unremarkable: &Display = &193_u8; 
let remarkable: &Display = &0.0072973525664; 


// 下 面 返 回 特 型 对 象 指向 值 〈 而 非特 型 对 象 ) 的 大 小 /对 章 
// 这 些 信息 来 自 特 型 对 象 引 用 的 虚拟 表 
assert_eq!(std::mem::size of_val(unremarkable), 1); 
assert eq!(std::mem::align_of _val(remarkable), 8); 


21.7.5 ”指针 算术 


在 内 存 中 ，Rust 把 数组 、 切 片 或 向 量 的 元 素 排列 为 一 个 连续 的 块 ， 如 图 21-1 所 示 。 元 素 
是 均匀 分 布 的， 因此 每 个 元 素 占 用 size 字 方 ， 而 第 i 个 元 素 开 始 于 第 i * size 字 市 。 




















array[9] 的 字 节 偏 array[3] 的 字 节 偏 
移 量 是 0 (0*4) 移 量 是 12 (3*4) 








数组 的 起 始 地 址 











21-1: 内 存 中 的 数组 


这 样 的 一 个 好 处 是 ， 如 果 你 有 两 个 指向 数组 元 素 的 原始 指针 ， 那 么 比较 指针 可 以 得 到 与 比 
较 元 素 索 引 一 样 的 结果 。 如 果 i < j， 那 么 指向 第 i 个 元 素 的 原始 指针 也 小 于 指向 第 j 个 
元 素 的 原始 指针 。 这 样 在 遍历 数组 时 ， 就 可 以 使 用 原始 指针 作为 界限 。 事 实 上 ， 标 准 库 中 
对 切片 的 简单 迭代 器 就 是 这 样 定义 的 : 

struct Iter<'a, T: 'a>{ 


ptr: *const T， 
end: *const T， 








} 


ptr 字段 指向 迭代 应 该 产生 的 下 一 个 元 素 ， 而 end 字段 是 一 个 界限 : 当 ptr == end 时， 大 
代 完 成 。 
数组 布局 的 另 一 个 好 处 是 ， 如 果 element_ptr 是 指向 某 个 数组 第 i 个 元 素 的 *const T 或 
*mut T 原始 指针 ， 那 么 eLement_ptr.offset(o) 就 是 指 癌 第 (i + o) 个 元 素 的 原始 指针 ， 其 
定义 等 价 于 如 下 代码 : 

fn offset(self: *const T, count: isize) -> *const T 


where T: Sized 


{ 
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Let bytes_per_element = std::mem::size of::<T>() as isize; 
Let byte_offset = count * bytes_per_element; 
(self as isize).checked_add(byte_offset).unwrap() as *const T 


} 


std: :mem: :size_of::<T> 国 数 返 回 类 型 T 的 字 节 大 小 。 因 为 按照 定义 isize 足够 保存 一 个 
地 址 ， 所 以 可 以 将 一 个 基础 指针 转换 为 一 个 isize， 对 得 到 的 值 执行 算术 运算 ， 然 后 再 把 
结果 转换 为 一 个 指针 。 


可 以 产生 指向 数组 末尾 之 后 第 一 个 字 节 的 指针 。 虽 然 不 能 解 引 用 这 样 的 指针 ， 但 可 以 用 它 
来 表示 循环 的 上 限 ， 或 者 用 于 边界 检查 。 

不 过 ， 使 用 offset 产生 一 个 指向 这 个 位 置 之 后 或 者 指向 数组 开头 之 前 的 指针 是 未 定义 行 
为 ， 即 使 你 从 来 没有 解 引 用 它 。 为 方便 优化 ，Rust 会 假设 在 i 为 正 值 是 ptr.offset(i) > 
ptr， 在 i 为 负 值 是 ptr.offset(i) < ptr。 这 个 假设 看 起 来 安全 ， 但 在 offset 计算 isize 
值 溢出 时 可 能 就 不 成 立 了 。 如 果 将 宇 限 制 在 与 ptr 相同 的 数组 中 ， 则 不 会 发 生 液 出， 毕竟 
数组 本 身 不 会 溢出 地 址 空间 的 边界 。( 为 了 让 指向 末尾 之 后 第 一 个 字 节 的 指针 安全 ，Rust 
永远 不 会 在 地 址 空间 的 上 端 保存 值 。) 


如 果 确 实 需要 将 指针 偏 移出 与 之 关联 数组 的 这 个 界限 ， 可 以 使 用 wrapping_offset 方法 。 
这 个 方法 与 offset 等 价 ， 但 Rust 不 会 假设 ptr.wrapping_offset(i) 和 ptr 本 身 的 相对 顺 
序 。 当 然 ， 除 非 偏 移 后 的 指针 落 在 数组 范围 内 ， 和 否则 还 是 不 能 解 引 用 这 种 指针 。 


21.7.6 移入 和 移出 内 存 
如 果 你 正在 实现 的 类 型 需要 管理 自己 的 内 存 ， 那 么 就 要 跟踪 内 存 的 哪 一 部 分 保存 着 活 的 
值 ， 哪 个 是 未 初始 化 的 ， 就 像 Rust 对 局 部 变量 所 做 的 那样 。 来 看 如 下 代码 : 


Let pot = "pasta".to_string(); 
let plate; 









































plate = pot; 


上 面 代码 运行 之 后 的 内 存 状 态 如 图 21-2 所 示 。 





pot plate 











图 21-2; 将 字符 串 从 一 个 局 部 变量 转移 到 另 一 个 局 部 变量 


赋值 之 后 ，pot 变 成 了 未 初始 化 ， 而 plate 拥有 了 这 个 字符 串 。 


在 机 器 层面 上 ， 转 移 要 对 源 做 什么 并 没有 规定 ， 而 实践 中 通常 什么 也 不 做 。 以 上 赋值 可 能 
仍然 会 让 pot 持 有 对 字符 串 的 指针 、 容 量 和 长 度 。 自 然 ， 如 果 再 把 它 也 看 成 活 值 将 是 灾难 
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性 的 ， 而 Rust 可 以 保证 你 不 会 这 样 做 。 
同样 的 情形 也 适用 于 管理 自己 内 存 的 数据 结构 。 假 设 运行 了 如 下 代码 : 


Let mut noodles = vec!["udon" .to_string()]; 


Let soba = "soba" .to_string(); 
let last; 


内 存 中 的 状态 如 图 21-3 所 示 。 








noodles soba 


last 











图 21-3: 具有 未 初始 化 、 空 闲 容量 的 向 量 


这 个 向 量 有 空闲 容量 保存 另 一 个 元 素 ， 
西 。 假 设 又 运行 了 如 下 代码 : 


noodles.push(soba); 


应 
并 
地 
对 
[on 
洁 


Y 圾 ”， 可 能 是 该 内 存 之 前 保存 的 东 


把 新 字符 串 推 到 向 量 中 将 未 初始 化 内 存 转 换 为 了 新 元 素 ， 如 图 21-4 所 示 。 
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图 21-4: 把 soba 值 推 到 向 量 中 之 后 


向 量 初始 化 了 空闲 容量 以 拥有 这 个 字符 串 ， 并 将 其 长 度 加 1 表明 增加 了 一 个 新 的 活 元 素 。 
这 个 向 量 成 了 这 个 字符 串 的 所 有 者 ， 现 在 可 以 引用 其 第 二 个 元 素 了 ， 而 清除 向 量 也 会 释放 
两 个 字符 串 。 但 soba 现在 变 成 了 未 初始 化 状态 。 
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最 后 ， 再 看 看 从 向 量 中 弹出 一 个 值 会 怎么 样 : 


Last = noodles.pop().unwrap(); 


在 内 存 中 ， 现 在 的 状态 如 图 21-5 所 示 。 














noodles soba last 





~ 


四 四 回回 














21-5: 把 向 量 中 的 元 素 弹出 到 last 之 后 








变量 Last 现在 取得 了 这 个 字符 串 的 所 有 权 。 向 量 将 容量 减 1 表示 原来 用 于 保存 字符 串 的 空 

间 现 在 未 初始 化 。 

与 前 面 的 pot 和 pasta 一 样 ，soba、last 和 向 量 空闲 空间 的 位 模式 可 能 是 相同 的 。 但 只 

Last 才 拥 有 这 个 值 。 把 另外 两 个 中 的 任何 一 个 当成 活 值 都 不 正确 。 

初始 化 值 真正 的 定义 是 将 其 作为 活 值 (treated as live)。 写 入 值 的 字 节 通常 是 初始 化 的 一 部 

分 ， 但 这 一 部 分 仅仅 是 为 了 将 其 作为 活 值 做 的 准备 。 

Rust 在 编译 时 会 跟踪 局 部 变量 。Vec、HashMap、Box 等 类 型 会 动态 跟踪 自己 的 缓冲 区 。 如 

果 你 也 要 实现 一 个 管理 自己 内 存 的 类 型 ， 那 需要 做 相同 的 事 。 

Rust 提供 了 两 个 基本 操作 以 便 实现 这 样 的 类 型 。 

。 std::ptr::read(src) 移出 src 指向 位 置 的 值 ， 将 所 有 权 转 移 给 调用 者 。 调 用 read 之 后 ， 
必须 将 *src 作为 未 初始 化 内 存 。src 参数 应 该 是 一 个 *const T 原始 指针 ， 其 中 T 是 一 

个 固定 大 小 类 型 。 

Vec: :pop 在 后 台 就 是 执行 的 这 个 操作 。 弹 出 值 会 调用 read 将 值 移出 缓冲 区 ， 然 后 减少 
长 度 以 便 将 该 空间 标记 为 未 初始 化 容量 。 

。 std::ptr::write(dest，value) 把 value 移入 dest 指向 的 位 置 ， 该 位 置 在 这 个 调用 前 必 
须 是 未 初始 化 内 存 。 引 用 目标 随后 拥有 了 这 个 值 。 这 里 的 dest 必须 是 一 个 *mut T 原始 
指针 ， 而 value 必须 是 一 个 T 值 ， 其 中 T 是 固定 大 小 类 型 。 

Vec: :push 在 后 台 就 是 执行 的 这 个 操作 。 推 入 值 会 调用 write 将 值 移 入 下 一 个 可 用 空间 ， 
然后 增加 长 度 以 便 将 该 空间 标记 为 有 效 元 素 。 
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这 两 个 都 是 自由 国 数 ， 不 是 原始 指针 类 型 上 的 方法 。 

注意 ， 不 能 使 用 Rust 的 安全 指针 类 型 完成 上 述 操作 。 安 全 指针 类 型 要 求 其 引用 目标 必须 始 
终 是 初始 化 的 ， 因 此 转换 未 初始 化 内 存 为 值 或 相反 的 操作 超出 了 这 个 范围 。 原 始 指针 可 以 
满足 这 个 需求 。 

标准 库 也 提供 了 将 值 的 数组 从 一 个 内 存 块 转移 到 另 一 个 内 存 块 的 函数 。 


。 std: :ptr::copy(src，dst，count) 将 count 个 值 的 数组 在 内 存 中 从 src 转移 到 dst， 就 
像 手写 循环 每 次 read 和 write 一 个 元 素 一 样 。 调 用 前 目标 内 存 必 须 是 未 初始 化 的 ， 调 
用 后 源 内 存 变量 未 初始 化 。src 和 dst 参数 必须 是 *const T 和 *mut T 原始 指针 ，count 
必须 是 usize。 

。 std::ptr::copy_nonoverlapping(src，dst，count) 与 相应 的 copy 调用 类 似 ， 只 不 过 它 
的 协议 进一步 要 求 源 和 目标 内 存 块 必须 不 能 重合 。 这 可 能 比 调用 copy 稍微 快 一 点 。 


下 面 是 另外 两 组 read 和 write 函数 ， 它 们 也 在 std: :ptr 模块 中 。 


read_unaligned 和 write_unaLigned 国 数 类 似 于 read 和 write， 只 不 过 指针 不 需要 像 要 
求 常规 引用 目标 那样 对 齐 。 这 两 个 函数 可 能 比 纯 read 和 write 国 数 慢 一 点 。 
read_volatile 和 write_volatile 国 数 是 C 或 C++ 中 volatile 读 和 写 的 对 应 函数 。 


21.7.7 示例 : GapBuffer 
下 面 这 个 例子 展示 了 如 何 使 用 前 面 介 绍 的 原始 指针 函数 。 


假设 你 在 编写 一 个 文本 编辑 器 ， 正 在 寻找 表示 文本 的 类 型 。 可 以 选择 String， 使 用 insert 
和 remove 方法 在 用 户 输入 时 插入 和 删除 字符 。 但 如 果 是 在 一 个 大 文件 开头 编辑 文本 ， 那 这 
些 方法 开销 会 比较 大 : 插入 新 字符 涉及 在 内 存 中 将 所 有 其 他 字符 串 都 向 右 移动 ， 删 除 则 会 
反 向 向 左 移动 。 我 们 希望 这 些 常用 操作 开销 小 一 些 。 


Emacs 编辑 器 使 用 了 一 个 名 为 间隙 缓冲 (gap buffer) 的 简单 数据 结构 ， 该 数据 结构 插入 和 
删除 字符 的 时 间 为 常量 值 。 相 比 于 String 将 其 所 有 空闲 容量 放 在 文本 末尾 ， 使 得 push 和 
pop 操作 很 快 ， 间 际 缓 冲 则 会 将 其 空间 容量 放 在 文本 中 间 ， 编 辑 都 在 中 间 发 生 。 这 样 的 空 
朵 容量 被 称 为 间隙 。 在 间隙 插入 和 删除 元 素 开 销 很 小 ， 按 需要 简单 地 收缩 或 放大 间隙 即 
可 。 通 过 将 文本 从 间 阶 一 侧 移动 到 另 一 侧 可 以 把 间 隐 移动 到 任意 位 置 。 在 间隙 为 空 时 ， 再 
迁移 到 一 个 更 大 的 缓冲 区 。 

虽然 在 间 隐 缓冲 中 插入 和 删除 很 快 ， 但 改变 操作 的 位 置 需要 将 间隙 移动 到 新 位 置 。 移 动 元 
素 所 需 时 间 与 移动 距离 成 正比 。 好 在 ， 典 型 的 编辑 活动 都 是 在 这 个 缓冲 区 附近 做 一 通 修 
改 ， 在 其 他 地 方 修改 的 概率 不 高 。 

本 市 将 用 Rust 实现 一 个 间隙 缓冲 。 为 避免 因 UTF-8 而 分 心 ， 我 们 直接 让 缓冲 区 存储 char 
值 。 但 操作 的 原理 与 使 用 其 他 形式 存储 文本 相同 。 

首先 ， 我 们 会 展示 一 下 间 际 缓冲 的 实际 应 用 。 以 下 代码 创建 了 一 个 GapBuffer， 向 其 中 插 
入 一 些 文本 ， 然 后 把 插入 点 移动 到 恰好 位 于 最 后 一 个 词 之 前 : 
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use gap: :GapBuffer; 


Let mut buf = GapBuffer::new(); 
buf.insert iter("Lord of the Rings".chars()); 
buf.set_position(12); 


运行 以 上 代码 后 ， 缓 冲 区 类 似 图 21-6 所 示 。 








索引 

0 11 12 16 
oe Tofff Trinlel [RnlLsls 
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元 素 间隙 〈 空 闲 容量 ) 更 多 元 素 











图 21-6: 包含 一 些 文本 的 间隙 缓冲 





插入 涉及 用 新 文本 填充 间 险 。 以 下 代码 添加 了 一 个 词 并 破坏 了 这 个 “胶卷 ”: 
buf.insert iter("Onion ".chars()); 


结果 内 存 状 态 如 图 21-7 所 示 。 
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图 21-7: 包含 更 多 文本 的 间隙 缓冲 


以 下 是 GapBuffer 类 型 


mod gap { 
use std; 
use std::ops::Range; 


pub struct GapBuffer<T> { 
// 元 素 存 储 。 这 个 存储 有 我 们 需要 的 容量 ， 但 它 的 长 度 始终 为 6 
// GapBuffer 将 其 元 素 和 间隙 放 到 了 这 个 Vec 的 “未 用 ”容量 中 
storage: Vec<T>， 























// 未 初始 化 元 素 的 范围 在 storage 的 中 间 
// 在 这 个 范围 之 前 和 之 后 的 元 素 始终 是 初始 化 的 
gap: Range<usize> 
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GapBuffer 以 一 种 奇怪 的 方式 使 用 其 storage 字段 。 


素 (或 者 说 基本 不 存储 )， 





” 它 不 会 真正 在 这 个 向 量 中 存储 任何 元 
而 只 是 调用 Vec: :with_capacity(n) 取得 一 块 足够 放下 nn 个 值 的 


内 存 ， 通 过 这 个 向 量 的 as -ptr as_mut_ptr 方法 获得 指向 该 内 存 的 原始 指针 ， A 


自己 的 逻辑 








要 的 ， 它 有 


于 用 这 个 缓冲 区 
对 应 的 内 存 块 ， 而 不 会 释放 自 be 
自己 的 Drop 实现 ， 知 道 


o 





个 向 量 的 长 度 始终 为 0。 当 这 个 vec 被 清除 时 ， 它 会 释放 
因为 它 不 知道 自己 有 元 素 。 这 正 是 a 想 
活 的 元 素 都 放 在 哪里 ， 因 此 可 以 正确 清除 它们 。 








GapBuffer 最 简单 的 方法 也 是 我 们 想 要 的 : 


GapBuffer<T> { 
fn new() -> GapBuffer<T> { 
GapBuffer { storage: Vec: 


impl<T> 
pub 





返回 在 不 重新 分 配 的 前 提 下 这 个 GapBuffer 可 以 容 
fn capacity(&self) -> usize { 
self.storage.capacity() 








返回 这 个 GapBuffer 当 前 容纳 的 元 素数 量 
fn len(&self) -> usize { 
self.capacity() - self.gap.len() 





返回 当前 插入 位 置 
fn position(&self) 
self.gap.start 








-> usize { 


} 


:New(), gap: 0..0 } 


纳 的 元 素数 量 





它 还 在 很 多 下 面 这 样 的 函数 中 ， 通 过 一 个 实用 方法 返回 
指针 。 这 就 是 Rust， 最 终 我 们 需要 一 个 返回 mut 指针 





























与 前 面 的 方法 不 同 ， 这 些 方法 不 是 公有 的 。 继 续 前 务 
/// 返回 底层 存储 中 第 index 个 元 素 的 指针 ， 与 间隙 无 关 
/// 


/// 安全 : index 必 须 是 seLf .storage 中 的 一 个 有 效 索 引 

unsafe fn space(&self, index: usize) -> *const T { 
seLf .storage.as_ptr().offset(index as isize) 

} 

/// 返 层 存储 中 第 

/// 

/// 安全 : index 必 须 是 seLf .storage 中 的 一 个 有 效 索 引 

unsafe fn space_mut(&mut self, index: usize) 











回 底 


给 定 索 引 对 应 的 缓冲 区 元 素 的 原始 


的 方法 和 一 个 返回 const 指针 的 方法 。 
[的 impl 块 : 


index 个 元 素 的 可 修改 指针 ， 与 间隙 无 关 


-> xmut T { 


seLf .storage.as_mut_ptr().offset(index as isize) 





要 找到 





类 型 ， 











alloc 包 的 RawVec 





注 2: 处 理 这 个 的 更 好 方式 是 使 用 





给 定 索 引 的 元 素 ， 必 须 考虑 这 个 索引 在 间 隐 之 前 还 是 


但 这 个 包 在 写作 本 书 时 还 


之 后 ， 然 后 再 适当 调整 : 








不 稳定 。 
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/// 返回 第 index 个 元 素 在 缓冲 区 中 的 偏 移 量 ， 考 虑 间 队 的 存在 
/// 这 个 方法 不 检查 索引 是 否 在 范围 内 ， 但 永远 不 会 返回 间隙 中 的 索引 
fn index_to_raw(&self, index: usize) -> usize { 
if index < self.gap.start { 
index 
} elsef 
index + self.gap.len() 

















} 
} 


/// 返回 对 第 index 个 元 素 的 引用 ， 如 果 index 越 界 则 返回 None 
pub fn get(&self, index: usize) -> Option<&T> { 
Let raw = self.index_ to_raw(index); 
if raw < self.capacity() { 
unsafe { 
// 只 检查 raw 与 self.capacity()，index_to_raw 会 跳 过 间 附 ， 
// 所 以 这 样 是 安全 的 


Some(&*self.space(raw)) 


























} 
} elsef 
None 
} 
} 


当 在 缓冲 区 的 不 同 部 分 执行 插入 和 删除 操作 时 ， 需 要 把 间 阶 移动 到 新 位 置 。 向 右 移动 间 阶 
意味 着 把 元 素 向 左 移动 ， 反 之 亦 然 。 这 就 像 水 平 尺 中 的 气泡 ， 当 液体 朝 一 个 方向 流动 时 ， 
气泡 会 朝 另 一 个 方向 移动 : 

/// 将 当前 插入 位 置 设置 为 pos 

/// 如 果 pos 越 界 ， 则 诈 异 

pub fn set_position(&mut self, pos: usize) { 


if pos > self.len() { 
panic!("index {} out of range for GapBuffer", pos); 











} 
unsafe { 
Let gap = self.gap.clone(); 
if pos > gap.start { 
// pos 落 在 间隙 后 面 。 通 过 将 间隙 后 面 的 元 素 移 动 到 间隙 的 
// 前 面 来 让 间隙 向 右 移动 
let distance = pos - gap.start; 
std: :ptr::copy(self.space(gap.end), 
self.space_mut(gap.start), 
distance); 
} else if pos < gap.start { 
// pos 落 在 间 阶 前面。 通过 将 间隙 前 面 的 元 素 移 动 到 间 阶 的 
// 后 面 来 让 间隙 向 左 移动 
let distance = gap.start - pos; 
std: :ptr::copy(seLf.space(pos ) ， 
seLf .space_mut(gap.end - distance), 
distance ) ; 
} 
self.gap = pos .. pos + gap.len(); 
} 
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个 函数 使 用 std: :ptr: :copy 方法 移动 元 素 。copy 要 求 目标 内 存 未 初始 化 ， 最 后 让 源 内 存 
变 成 未 初始 化 。 源 和 目标 范围 可 能 重 琶 ， 但 copy 可 以 正确 处 理 这 种 情况 。 因 为 间隙 在 这 
个 调用 前 是 未 初始 化 的 内 存 ， 所 以 这 个 函数 会 调整 间隙 的 位 置 以 覆盖 被 这 次 复制 腾 出 的 空 
间 ， 从 而 满足 copy 函数 的 协议 。 


元 素 的 插入 和 删除 相对 简单 。 插 入 接收 间隙 的 一 块 空间 用 于 容纳 新 元 素 ， 删 除 则 将 值 移出 
并 扩大 间隙 以 覆盖 其 原来 占用 的 空间 : 


/// 在 当前 插入 位 置 插入 eLt， 将 播 入 位 置 放 在 它 的 后 面 
pub fn insert(&mut self, elt: T) { 
if self.gap.len() == 0 { 
self.enlarge_gap(); 





} 


unsafe { 

let index = self.gap.start; 

std: :ptr::write(self.space mut(index), elt); 
} 
self.gap.start += 1; 


} 


/// 在 当前 插入 位 置 插入 iter 生 成 的 元 素 ， 将 插入 位 置 放 在 它们 的 后 面 
pub fn insert iter<I>(&mut self, iterable: I) 
where I: IntoIterator<Item=T> 
{ 
for item in iterable { 
self.insert(item) 


} 








} 


/// 删除 并 返回 位 于 插入 位 置 之 后 的 元 素 ， 
/// 如 果 插 入 位 置 在 GapBuffer 的 末尾 则 返回 None 
pub fn remove(&mut self) -> Option<T> { 
if self.gap.end == self.capacity() { 
return None; 


} 




















let element = unsafe { 
std: :ptr::read(self.space(self.gap.end)) 
}; 
self.gap.end += 1; 
Some(element) 


} 


与 Vec 使 用 std::ptr::write 实现 推 人 和 使 用 std::ptr::read 实现 弹出 一 样 ，GapBuffer 也 
使 用 write 实现 insert， 使 用 read 实现 remove。 正 如 Vec 必须 调整 其 长 度 以 维护 初始 化 的 
元 素 与 空间 容量 之 间 的 界限 ，GapBuffer 会 调用 它 的 间 阶 。 


在 间隙 被 填 满 时 ，insert 方法 必须 增 大 这 个 缓冲 区 以 取得 更 多 空闲 空间 。(impl 块 最 后 的 ) 
enlarge_gap 方法 负责 处 理 这 个 
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/// 将 seLf.storage 的 容量 增 大 一 倍 
fn enLarge_gap(&mut self) { 
Let mut new_capacity = self.capacity() * 2; 
if new_capacity == 0 全 


// 当前 向 





量 是 空 和 


量 是 空 的 


// 选择 一 个 合 理 的 起 始 容量 


new_capacity = 4; 




















// 我 们 不 知道 缩放 Vec 对 其 “未 用 ”容量 的 影响 ， 因 此 就 简单 地 
// 创建 了 一 个 新 向 量 并 转移 了 元 素 


Let mut new = Vec::with capacity(new_capacity); 


Let after_gap = 
Let new_gap = self.gap.start .. 


unsafe { 





seLf .capacity() - self. 


// 转移 位 于 间隙 之 前 的 元 素 


std: 


sp: 


:copy_nonoverlapping(self. 








gap.end; 


new.capacity() - after_gap; 


space(0), 


new.as_mut_ptr(), 


self. 


// 转移 位 于 间隙 之 后 的 元 素 


Let new_gap_end = new.as_mut_ptr().offset(new_gap.end as isize); 


std: 


} 
// 这 样 





ptr 


会 释放 | 


:copy_nonoverlapping(self. 


gap.start); 


space(self.gap.end), 


new_gap_end, 
after_gap); 











日 向 量 ， 但 不 会 清除 元 素 ， 因 








self.storage = new; 


self.gap = 


} 


new_gap; 


set_position 必须 使 用 copy 在 间隙 中 来 回 移动 元 素 ，enlarge_gap 则 可 以 使 用 copy_ 
因为 它 是 把 元 素 移 动 到 一 个 全 新 的 缓冲 区 。 


nonover lapping, 


把 新 向 量 移动 到 self.storage 会 清除 旧 向 量 。 因 


























为 向 量 长 度 始终 为 0， 所 以 旧 向 量 认 为 自 


己 没 有 需要 清除 的 元 素 ， 于 是 就 直接 把 缓冲 区 释放 了 。 更 巧妙 的 是 ，copy_nonoverlapping 


会 让 源 内 存 变 成 未 初始 化 ， 








最 后 需要 确保 清除 GapBuffer 会 清除 其 所 有 元 素 : 


impl<T> Drop for GapBuffer<T> { 
fn drop(&mut self) { 
unsafe { 


std: :ptr: 

} 

for i in self.gap.end .. 
std: :ptr: 

} 


for i in 0 .. self.gap.start { 
:drop_in place(self.space mut(i)); 


因此 旧 向 量 认为 现在 所 有 元 素 都 归 新 向 量 所 有 是 正确 的 。 


self.capacity() { 
:drop_in place(self.space_mut(i)); 





元 素 都 在 间隙 的 前 后 ， 因 此 需要 迭代 每 个 区 域 并 使 用 std: :ptr::drop_in_place 国 数 清除 每 个 
元 素 。 这 个 drop_in_place 函数 是 一 个 实用 程序 ， 其 行为 类 似 于 drop(std:: ptr::read(ptr))， 
但 不 会 费事 地 把 值 转移 到 调用 者 〈 所 以 才 可 以 在 非 固定 大 小 类 型 上 使 用 )。 而 且 就 像 在 
enlarge_gap 中 一 样 ， 当 向 量 self.storage 被 清除 时 ， 其 缓冲 区 也 是 真 的 变 成 了 未 初始 化 。 


与 本 章 展 示 的 其 他 类 型 一 样 ，GapBuffer 保证 自己 的 不 变性 足以 遵守 所 使 用 的 每 个 不 安全 
特性 的 协议 。 因 此 它 的 所 有 公有 方法 都 不 需要 标记 为 不 安全 。GapBuffer 实现 了 一 个 安全 
的 接口 ， 而 这 个 接口 的 功能 如 果 使 用 安全 代码 来 写 是 不 会 这 么 高 效 的 。 


21.7.8 不 安全 代码 中 的 证 异 安全 性 

在 Rust 中 ， 许 异 通 常 不 会 导致 未 定义 行为 ，panic! 宏 并 不 是 一 个 不 安全 特性 。 但 当 你 决 
定 使 用 不 安全 代码 时 ， 诈 异 安全 性 是 必须 要 考虑 的 问题 。 

以 上 一 节 中 的 GapBuffer: : remove 方法 为 例 : 


pub fn remove(&mut self) -> Option<T> { 
if self.gap.end == self.capacity() { 
return None; 





















































} 


let element = unsafe { 
std: :ptr::read(self.space(self.gap.end)) 


self.gap.end += 1; 
Some(element) 


} 
这 里 调用 read 将 位 于 间隙 后 面 的 元 素 移 到 了 这 个 缓冲 区 之 外 ， 原 来 的 空间 变 成 了 未 初始 
化 。 好 在 下 一 行 代 码 增 大 了 间 队 以 覆盖 这 个 空间 ， 因 此 在 函数 返回 的 时 候 ， 一 切 如 常 : 所 
有 间隙 外 的 元 素 都 是 初始 化 的 ， 而 所 有 间 隐 内 的 元 素 都 是 未 初始 化 的 。 
考虑 这 样 一 种 情况 : 在 调用 read 之 后 、 调 整 到 self.gap.end 之 前 ， 代 码 试图 使 用 一 个 可 
能 许 异 的 特性 ， 比 如 通过 索引 访问 切片 。 在 这 两 个 操作 之 间 突 然 退 出 会 导致 capBuffer 中 
有 一 个 未 初始 化 的 元 素 位 于 间 隐 之 外 。 下 次 调用 remove 可 能 会 尝试 再 读 取 它 ， 即 使 简单 地 
清除 GapBuffer 也 会 尝试 清除 它 。 这 两 个 都 是 未 定义 行为 ， 因 为 它们 访问 了 未 初始 化 内 存 。 
类 型 的 方法 在 完成 自己 的 任务 时 短暂 放松 类 型 的 不 变性 ， 然 后 返回 前 再 把 一 切 恢复 正常 是 
不 可 避免 的 。 这 样 的 方法 中 出 现 论 异 可 能 中 断 这 个 恢复 过 程 ， 导致 类 型 处 于 不 一 致 状态 。 
如 果 类 型 只 使 用 安全 代码 ， 那 么 这 种 不 一 致 可 能 会 导致 类 型 行为 失常 ， 但 不 会 导致 未 定义 
行为 。 但 是 使 用 不 安全 特性 的 代码 经 常 要 指望 其 不 变性 满足 这 些 特 性 的 协议 。 破 坏 不 变性 
会 导致 破坏 协议 ， 而 破坏 协议 会 导致 未 定义 行为 。 
在 使 用 不 安全 特性 时 ， 必 须 格 外 注意 检查 这 些 敏 感 区 域 ， 确 保 它 们 不 会 做 引起 许 异 的 事 。 


21.8 外 来 函数 : 在 Rust 中 调用 C 和 C++ 


Rust 外 来 函数 接口 允许 Rust 代码 调用 用 C 或 C++ 编写 的 函数 。 
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本 节 会 编写 一 个 与 Libgit2 链接 的 程序 ，Libgit2 是 一 个 操作 Git 版 本 控制 系统 的 C 库 。 我 
们 会 先 展示 如 何在 Rust 中 直接 使 用 C 函数 ， 然 后 再 展示 如 何 构建 调用 Libgit2 的 安全 接 
口 ， 这 些 灵感 都 来 自 开 源 的 git2-rs 包 。 
假设 你 熟悉 C 和 编译 、 链 接 C 程序 的 机 制 。C++ 的 使 用 与 此 类 似 。 假 设 你 熟悉 Git 版 本 控 
制 系统 。 


21.8.1 查找 共有 数据 表示 


Rust 与 C 的 公 因 子 是 机 器 语言 ， 因 此 为 了 预见 Rust 值 在 C 代码 中 的 表示 ， 或 者 相反 ， 需 
要 考虑 它们 的 机 器 级 表示 。 本 书 从 始 至 终 一 直 强 调 值 在 内 存 中 的 实际 表示 ， 因 此 你 可 能 
经 注意 到 C 和 Rust 在 内 存 中 的 数据 表示 有 很 多 共性 。 比 如 ，Rust 的 usize 和 C 的 size_t 
完全 相同 ， 而 结构 体 在 两 种 语言 中 基本 上 也 是 一 回 事 。 为 建立 Rust 与 C 类 型 的 对 应 关系 ， 
可 以 先 从 原始 类 型 开始 ， 然 后 再 过 渡 到 更 复杂 的 类 型 。 

作为 一 门 系统 编程 语言 ，C 对 其 类 型 的 表示 一 直 非 常 宽松 。 比 如 ，int 通常 是 32 位 长 ， 但 
更 长 也 可 以 ， 更 短 比 如 16 位 也 行 。 再 比如 ，char 可 以 有 符号 也 可 以 无 符号 。 为 了 对 应 这 
种 变化 ，Rust 的 std: :os: :raw 模块 定义 了 一 组 Rust 类 型 ， 保 证 与 某 些 C 类 型 具有 相同 的 
表示 。 这 些 主要 包括 原始 整数 和 字符 类 型 ， 如 表 21-1 所 示 。 

表 21-1: 类 型 对 照 


















































C 类 型 对 应 的 std: :os::raw 类 型 
short c_short 

int c_int 

Long c_long 

long long c_longlong 

unsigned short c_ushort 
unsigned、unsigned int c_uint 

unsigned long c_ulong 

unsigned long long c_ulonglong 

char c_char 

signed char c_schar 

unsigned char c_uchar 

float c_float 

double c_double 

void * const void * *mut c_void、 *const c_void 


关于 这 个 表 ， 需 要 注意 以 下 几 点。 


。 除了 c_ void， 这 里 所 有 的 Rust 类 型 都 是 某 个 原始 Rust 类 型 的 别名 ， 比 如 c_char 是 i8 
或 u8。 

。 没有 被 认可 的 Rust 类 型 对 应 于 C 的 booL。 目 前 ，Rnust 的 bool 始终 要 么 是 0 要么 是 一 
个 字 节 ， 所 有 主流 C 和 C++ 实现 的 表示 也 相同 。 不 过 ，Rust 语言 团队 并 未 承诺 将 来 会 
保持 这 个 表示 不 变 ， 因 为 这 样 意味 着 减少 优化 的 可 能 性 。 
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。 Rust 的 32 位 char 类 型 并 不 对 应 wchar t， 其 宽度 和 编码 因 实现 而 不 同 。C 的 char32_t 
类 型 接近 ， 但 它 的 编码 仍然 不 保证 是 Unicode。 

。 Rust 的 原始 usize 和 isize 类 型 与 C 的 size_t 和 ptrdiff_t 的 表示 相同 。 

。 C 和 C++ 指针 与 C++ 引用 对 应 Rust 的 原始 指针 类 型 *mut T 和 *const T。 
严格 来 讲 ，C 标准 允许 实现 使 用 Rust 没有 对 应 类 型 的 表示 ， 比 如 36 位 整数 、 有 符号 值 
的 符号 及 大 小 〈sign-and-magnitude) 表示 等 。 实 践 中 ,在 每 个 Rust 已 经 移植 到 的 平台 上 ， 
每 个 常用 的 C 整数 类 型 在 Rust 中 都 可 以 找到 对 应 的 类 型 ，bool 除外 。 


要 定义 兼容 C 结构 体 的 Rust 结构 体 类 型 ， 可 以 使 用 #[repr(C)] 属性 。 把 #[repr(C)] 属性 
放 到 结构 体 定义 上 方 ， 表 示 让 Rust 在 内 存 中 使 用 与 C 布局 其 结构 体 相同 的 方式 来 布局 这 
个 结构 体 的 字段 。 例 如 ，tibgit2 的 git2/errors.h 头 文件 定义 了 下 面 的 C 结构 体 ， 以 提供 前 
鲁 报 告 错 误 的 细 市 : 
typedef struct { 
char *message; 


int klass; 
} git error; 


可 以 像 下 面 这 样 定义 一 个 具有 相同 表示 的 Rust 类 型 : 


#[repr(C)] 

pub struct git_error { 
pub message: *const c_char, 
pub klass: c_int 


} 


#[repr(C)] 属性 只 影响 结构 体 本 身 的 布局 ， 不 影响 其 个 别 字段 ， 因 此 要 匹配 C 结构 体 ， 每 
个 字段 也 都 必须 使 用 类 C 的 类 型 ， *const c_char 对 应 char *、c_int 对 应 int， 等 等 。 


在 这 个 特例 中 ，#[repr(C)] 属性 可 能 不 会 改变 git_error 的 布局 。 指 针 和 整数 的 布局 方式 
并 不 太 多 。 但 C 和 C++ 保证 结构 体 的 成 员 以 声明 它们 的 顺序 出 现在 内 存 中 ， 且 每 个 成 员 
都 有 不 同 的 地 址 ， 而 Rust 为 了 减少 结构 体 占 用 的 内 存 会 对 字段 重新 排序 ， 没 有 大 小 的 类 型 
不 占 空间 。 这 里 的 #[repr(C)] 属性 告诉 Rust 对 给 定 类 型 遵守 C 的 规则 。 


同样 也 可 以 使 用 #[repr(C)] 控制 C 式 枚 举 的 表示 : 


#[repr(C)] 

enum git_error_code { 
GIT_OK 
GIT_ERROR 
GIT_ENOTFOUND 
GIT_EEXISTS 



































| 
天 PO 
和 和。 和。 和 


} 


正常 情况 下 ，Rust 在 选择 如 何 表示 枚 举 时 有 很 多 种 花招 儿 。 比 如 ， 前 面 提 到 Rust 会 使 用 
一 个 字 (如 果 T 是 固定 大 小 的 ) 来 存储 0ption<&T>。 如 果 没 有 #[repr(C)]，Rust 则 会 使 用 
一 个 字 贡 表示 这 个 git_error_code 枚 举 。 但 有 了 #[repr(C)]，Rust 就 会 像 C 那样 ,使 用 C 
的 int 大 小 的 一 个 值 。 
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此 外 ， 也 可 以 让 Rust 像 表 示 某 个 整数 类 型 一 样 表示 枚 举 。 如 果 前 面 的 定义 使 用 的 是 
#[repr(i16)]， 就 会 得 到 与 以 下 C++ 枚 举 相同 的 一 个 16 位 类 型 的 表示 : 


#include <stdint.h> 


enum git error_code: int16 t { 


GIT_OK = 0， 
GIT_ERROR = -1， 
GIT_ENOTFOUND = -3， 

= -4 


GIT_EEXISTS 
} 


在 Rust 和 C 之 间 传 递 字符 串 要 困难 一 些 。C 将 字符 串 表 示 为 一 个 指向 字符 数组 的 指针 ， 
以 一 个 空 字符 终结 。Rust 则 显 式 地 存储 字符 串 的 长 度 ， 或 是 保存 在 String 的 一 个 字段 中 ， 
或 是 作为 胖 指针 &str 的 第 二 个 字 。Rust 字符 串 不 是 以 空 字符 终结 的 ， 但 其 内 容 中 有 可 能 
包含 空 字符 ， 就 像 其 他 字符 一 样 。 


这 意味 着 不 能 把 Rust 字符 串 借用 为 C 字符 串 。 如 果 把 一 个 指向 Rust 字符 串 的 指针 传 给 C 
代码 ， 那 它 可 能 会 将 舱 入 的 空 字 符 误 认为 字符 串 的 末尾 ， 或 者 跑 到 字符 串 末 尾 却 找 不 到 
空 字符 。 反 过 来 ， 则 可 以 将 C 字符 串 指 针 借用 为 Rust 的 &str， 只 要 其 内 容 是 格式 正确 的 
UTF-8 即 可 。 

这 种 情况 实际 上 强制 Rust 把 C 字符 串 看 成 一 种 完全 不 同 于 String 和 &str 的 类 型 。 在 
std: :ffi 模块 中 ，CString 和 CStr 类 型 分 别 表示 所 有 型 和 借用 型 空 字 节 结尾 的 字 节 数组 。 
相 比 于 String 和 8&str，CString 和 CStr 的 方法 非常 有 限 ， 仅 限于 构建 和 转换 到 其 他 类 型 。 
下 一 节 将 介绍 这 两 个 类 型 。 


21.8.2 ”声明 外 来 函数 和 变量 


在 extern 块 中 可 以 声明 由 其 他 库 定 义 的 国 数 或 变量 ， 但 最 终 Rust 可 执行 文件 会 链接 到 它 
们 。 例 如 ， 每 个 Rust 程序 都 会 链接 到 标准 C 库 ， 因 此 可 以 像 下 面 这 样 在 Rust 中 声明 C 库 
的 strlen 函数 : 


use std::os::raw::C_char; 



































extern { 
fn strlen(s: *const c_char) -> usize; 


} 

这 样 就 告知 了 Rust 这 个 函数 的 名 字 和 类 型 ， 至 于 函数 定义 以 后 再 链接 。 

Rust 假设 在 extern 块 中 声明 的 函数 基于 C 的 惯例 传 参 并 接收 返回 值 。 这 些 函 数 被 定义 为 
unsafe 国 数 。 对 于 strlen 来 说 这 是 正确 的 ， 它 确实 是 一 个 C 国 数 ， 而 且 其 C 规范 要 求 传 
入 一 个 有 效 的 指针 ， 指 向 正确 结尾 的 字符 串 ， 而 这 是 Rust 无 法 强制 的 协议 。( 几 乎 任何 以 
原始 指针 为 参数 的 函数 都 必须 是 unsafe: 安全 Rust 可 以 基于 任意 整数 构建 原始 指针 ， 而 
解 引 用 这 样 的 指针 是 未 定义 行为 。) 

有 了 extern 块 ， 就 可 以 像 调 用 其 他 Rust 国 数 一 样 调用 strlen 了， 当然 类 型 还 是 暴露 了 它 
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外 来 者 的 身份 : 
use std::ffi::CString; 


Let rust_str = "I'LL be back"; 
let null_terminated = CString::new(rust_str).unwrap(); 
unsafe { 

assert_eq!(strlen(null_terminated.as_ptr()), 12); 


} 


CString: :new 函数 构建 了 一 个 空 字 符 结尾 的 C 字符 串 。 它 首先 会 检查 参数 是 否 骨 入 了 空 
字符 ， 因 为 娱 入 的 空 字符 不 能 在 C 字符 串 中 表示 ， 如 果 发 现 有 则 返回 错误 (这 也 是 对 结 
果 调 用 unwrap 的 原因 )。 否 则 ， 它 会 在 字符 串 末 尾 添加 空 字 节 ， 返 回 一 个 拥有 该 结果 字符 
串 的 CString。 


Cstring: :new 的 开销 取决 于 你 传 入 的 是 什么 类 型 。 它 可 以 接收 实现 Into<Vec<u8>> 的 任何 
值 。 传 入 &str 需要 一 次 分 配 和 一 次 复制 ， 因 为 转换 为 Vec<u8> 时 要 构建 这 个 字符 串 的 一 
个 分 配 在 堆 上 的 副本 ， 以 便 向 量 拥 有 它 。 而 传 入 String 的 值 只 需要 消费 该 字符 串 ， 接 管 
其 缓冲 区 ， 因 此 除非 追加 空 字符 会 强制 缓冲 区 扩张 ， 否则 转换 根本 不 需要 文本 复制 和 内 
存 分配 。 


CString 会 解 引用 为 CStr， 其 as_ptr 方法 会 返回 一 个 指向 字符 串 开头 的 *const c_char 指 
针 。 这 个 类 型 是 strlen 所 需要 的 。 在 这 个 例子 中 ，strlen 会 扫描 字符 串 ， 查 找 CString: :new 
放 到 末尾 的 空 字符 ， 然 后 返回 长 度 ， 即 字 市 数 。 


在 extern 块 中 还 可 以 声明 全 局 变量 。POSIX 系统 有 一 个 名 为 environ 的 全 局 变量 ， 其 保存 
进程 的 环境 变量 值 。 在 C 中 ， 它 是 这 样 声 明 的 : 

extern char **environ; 
在 Rust 中 ， 则 需要 这 样 写 ， 


use std: :ffiL::CStr; 
use std::os::raw::C_char; 















































extern { 
static environ: xmut *mut c_char; 
} 
要 打印 这 个 环境 变量 的 第 一 个 元 素 ， 要 这 样 做 : 
unsafe { 


if !environ.is null() && !(*environ).is null() { 
Let var = CStr::from ptr(*environ); 
println!("first environment variable: {}", 
var .to_string_lossy()) 


} 
在 确定 environ 至 少 有 一 个 元 素 后 ， 代 码 调 用 了 CStr::from_ptr 来 构建 借用 它 的 CStr。 
to_string_lossy 方法 返回 了 一 个 Cow<str>: 如 果 这 个 C 字符 串 包 含 格式 正确 的 UTF-8， 
Cow 就 将 其 内 容 借 用 为 &str， 不 包含 末尾 的 空 字 节 ， 否 则 ，to_string_lossy 在 堆 里 生成 相 
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应 文本 的 副本 ， 将 其 中 不 合法 的 UTF-8 序列 替换 为 正式 的 Unicode 替代 字符 '。'， 并 为 其 
构建 一 个 所 有 型 Cow。 不 管 怎样 ， 结 果 都 会 实现 Display， 因 此 可 以 使 用 格式 化 参数 们 把 
它 打印 出 来 。 


21.8.3 ”使 用 库 函 数 


要 使 用 某 个 库 提 供 的 函数 ， 可 以 在 extern 块 上 方 放 一 个 #[tlink] 属性 ， 标 示 出 Rust 需要 
链接 到 可 执行 文件 的 库 名 。 例 如 ， 下 面 这 个 程序 调用 了 libgit2 的 初始 化 和 停止 方法 ， 没 
干 别 的 事 : 


Use std::os::raw::C_ int; 














#[LinkCname = "git2")] 
extern { 
pub fn git libgit2 init() -> c_int; 
pub fn git libgit2 shutdown() -> c_int; 


} 
fn main() { 
unsafe { 
git libgit2 init(); 
git_ libgit2_ shutdown(); 
} 
} 





这 里 像 以 前 一 样 通过 extern 块 声明 了 外 部 函数 。 把 #[Llink(name ="git2")] 属性 放 到 包 
里 的 意思 是 说 ，Rust 在 创建 最 终 可 执行 文件 或 共享 库 时 ， 应 该 链接 git2 库 。Rust 使 用 
系统 链接 器 构建 可 执行 文件 。 在 Unix 上 ， 它 会 在 链接 器 命令 行 上 传 入 -tgit2 参数 ; 在 
Windows 上 ， 它 会 传 入 git2.LIB。 


#[link] 属性 也 可 以 用 于 库 包 。 在 构建 依赖 其 他 包 的 程序 时 ，Cargo 会 从 整个 依赖 图 中 提取 
这 些 链 接 说 明 ， 并 将 它们 全 部 包含 到 最 终 链 接 中 。 

对 这 个 例子 而 言 ， 如 果 你 想 在 自己 的 机 器 上 照 着 做 ， 还 需要 构建 Libgit2。 我 们 使 用 了 
Libgit2 的 0.25.1 版 。 要 编译 Libgit2， 则 需要 安装 CMake 构建 工具 和 Python 语言 。 我 们 
使 用 的 是 CMake 3.8.0 和 Python 2.7.13。 


构建 Libgit2 的 完整 说 明 可 以 在 其 网 站 找到 ， 其 实 很 简单 ， 这 里 将 进行 演示 。 在 Linux 上 ， 
假设 你 已 经 把 这 个 库 的 源 代码 解压 缩 到 了 目录 /home/jimb/libgit2-0.25.1 中 : 


$ cd /home/jimb/libgit2-0.25.1 
$ mkdir build 

$ cd build 

$ cmake .. 

$ cmake --build . 









































在 Linux 上 ， 这 样 会 生成 一 个 共享 库 /home/jimb/libgit2-0.25.1/build/libgit2.so.0.25.1， 以 及 
指向 它 的 一 批 符号 链接 ， 其 中 一 个 名 为 libgit2.so。 在 macOS 上 ， 结 果 类 似 ， 但 这 个 库 名 
为 libgit2.dylib。 
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在 Windows 上 上， 构建 也 很 简单 。 假 设 你 已 经 把 源 代 码 解 压缩 到 了 目录 C:\UsersJimB\ 
libgit2-0.25.1 中 。 在 Visual Studio 的 命令 行 中 执行 ， 

cd C:\Users\JimB\libgit2-0.25.1 

mkdir build 

cd build 


cmake -A x64 .. 
cmake --build . 


这 些 命令 跟 Linux 上 是 一 样 的 ， 只 是 在 第 一 次 运行 CMake 时 必须 指明 要 64 位 构建 ， 这 
样 才能 与 Rust 编译 器 匹配 。( 如 果 你 安装 的 是 32 位 Rust 工具 链 ， 那 么 在 第 一 个 cmake 命 
令 后 面 可 以 省 略 -A x64 标记 。) 这 样 可 以 生成 一 个 导入 库 git2.LIB 和 一 个 动态 链接 库 git2. 
DLL， 二 者 都 在 目录 Ci:\UsersJimB\ibgit2-0.25.1\build\Debug 中 。( 其 他 构建 说 明 针 对 的 是 
Unix， 不 适用 于 Windows 。) 


在 另外 一 个 目录 中 创建 Rust 程序 : 


$ cd /home/jimb 
$ cargo new --bin git-toy 


把 上 面 的 代码 放 到 src/main.rs 中 。 当 然 ， 如 果 你 现在 尝试 构建 ，Rust 则 不 知道 去 哪里 找 
libgit2. 





Vv VVvyV 


























$ cd git-toy 
$ cargo run 

Compiling git-toy vO.1.0 (file:///home/jimb/git-toy) 
error: linking with ‘cc failed: exit code: 1 

| 
hote: Ce” sn "2 "git2™ ;is 
note: /usr/bin/ld: cannot find -lgit2 

collect2: error: ld returned 1 exit status 


error: aborting due to previous error 
error: Could not compile ‘git-toy. 


To learn more, run the command again with --verbose. 


$ 


为 此 需要 写 一 个 构建 脚本 告诉 Rust 到 哪里 搜索 库 ， 也 就 是 Cargo 在 构建 时 要 编译 和 运行 的 
Rust 代码 。 构 建 脚 本 可 以 做 任何 事 ， 包 括 动态 生成 代码 、 编 译 要 包含 在 包 中 的 C 代码 等 。 
对 目前 而 言 ， 我 们 需要 给 可 执行 文件 的 链接 命令 添加 一 个 库 搜索 路 径 。Cargo 在 运行 这 个 
构建 脚本 时 ， 会 解析 构建 脚本 的 输出 ， 从 中 获取 这 个 信息 。 因 此 构建 脚本 只 要 把 相关 命令 
和 路 径 打印 到 标准 输出 即 可 。 


要 创建 构建 脚本 ， 需 要 在 Cargo.toml 文件 所 在 目录 下 添加 一 个 名 为 buildirs 的 文件 ， 包 售 
以 下 内 容 : 


fn main() { 
println!(r"cargo:rustc-link-search=native=/home/jimb/libgit2-0.25.1/build"); 
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这 是 Linux 的 正确 路 径 。 在 Windows 上 ， 需 要 把 native= 后 面 的 内 容 改 为 C:\UsersJimB\ 
libgit2-0.25.1\build\Debug。( 这 里 为 简单 起 见 ， 省 了 仪式 。 在 真正 的 应 用 中 ， 不 应 该 在 构建 
脚本 中 使 用 绝对 路 径 。 本 节 末 尾 会 引用 文档 的 正确 做 法 。) 


接 下 来 ， 告 诉 Cargo 这 是 你 的 构建 脚本 。 为 此 ， 要 在 Cargo.toml 文件 的 [package] 区 域 中 
加 上 build = "build.rs"。 整 个 文件 内 容 如 下 : 

















[package] 
name = "git-toy" 
version = "0.1.0" 


authors = ["You <you@example.com>"] 
build = "build.rs" 


[dependencies] 


现在 差不多 可 以 运行 程序 了 。 在 macOS 上 ， 应 该 可 以 立即 运行 。 而 在 Linux 系统 上 ， 运 行 
后 可 能 会 看 到 如 下 信息 : 


$ cargo run 
Compiling git-toy v0.1.0 (file:///home/jimb/git-toy) 
Finished dev [unoptimized + debuginfo] target(s) in 0.64 secs 
Running ‘target/debug/git-toy. 
target/debug/git-toy: error while loading shared libraries: 
libgit2.so.25: cannot open shared object file: No such file or directory 


$ 


这 说 明 虽 然 Cargo 成 功 地 在 可 执行 文件 中 链接 了 库 ， 但 它 不 知道 在 运行 时 如 何 找到 共享 
库 。Windows 对 此 会 弹出 一 个 对 话 框 来 显示 失败 消息 。 在 Linux 上 ， 必 须 设 置 LD_LIBRARY_ 
PATH 环境 变量 : 

















$ export LD_LIBRARY_PATH=/home/jimb/libgit2-0.25.1/build:$LD_LIBRARY_PATH 
$ cargo run 

Finished dev [unoptimized + debuginfo] target(s) in 0.0 secs 

Running ‘target/debug/git-toy. 
$ 


在 macOSs Es 则 需要 设置 DYLD_LIBRARY_PATH。 
在 Windows 上 ， 必 须 设 置 PATH 环境 变量 : 


> set PATH=C:\Users\JimB\libgit2-0.25.1\build\Debug;%PATH% 

> cargo run 
Finished dev [unoptimized + debuginfo] target(s) in 0.0 secs 
Running ‘target/debug/git-toy. 

> 


当然 ， 在 已 部 署 的 应 用 中 ， 我 们 不 想 为 了 找到 库 代码 而 设置 环境 变量 。 这 时 可 以 把 C 库 静 
态 链 接 到 Rust 包 。 这 样 就 会 把 库 的 对 象 文件 复制 到 包 的 .rlib 文件 中 ， 与 包 Rust 代码 的 对 
象 文件 和 元 数据 放 在 了 一 起 。 然 后 ， 整 个 集合 将 参与 最 终 链接 。 

Cargo 约定 ， 对 提供 C 库 访问 的 包 要 命名 为 LIB-sys 这 种 形式 ， 其 中 LIB 是 C 库 的 名 字 ， 
而 -sys 包 应 该 只 包含 静态 链接 库 和 带 有 extern 块 及 类 型 定义 的 Rust 模块 。 高 层级 接口 相 
应 地 归属 于 依赖 这 个 -sys 包 的 包 。 这 样 多 个 上 游 包 可 以 依赖 相同 的 -sys 包 ， 假 设 -sys 包 
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的 一 个 版 本 可 以 满足 它们 的 所 有 需求 。 


关于 Cargo 支持 构建 脚本 和 链接 系统 库 的 详细 信息 ， 请 参考 Cargo 在 线 文 档 。 文 档 中 介绍 
了 如 何 避 免 在 构建 脚本 中 使 用 绝对 路 径 、 控 制 编译 标记 、 使 用 pkg-config 工具 等 。git2- 
rs 包 也 是 一 个 用 来 模拟 的 好 例子 ， 它 的 构建 脚本 要 处 理 一 些 复杂 情况 。 


21.8.4 ”libgit2 的 原始 接口 
正确 使 用 Libgit2 首先 要 明确 两 个 问题 。 


。 在 Rust 中 使 用 Libgit2 函数 需要 接收 什么 ? 
。 如 何在 这 些 函 数 基础 之 上 构建 安全 的 Rust 接口 ? 


下 面 分 别 来 回答 这 两 个 问题 。 本 市 将 写 一 个 程序 ， 基 本 上 就 是 一 个 大 型 的 unsafe 块 ， 其 中 





全 都 是 不 符合 Rust 惯例 的 代码 ， 反 映 H 
我 们 称 这 个 程序 为 原始 接口 。 代 码 可 能 比较 乱 ， 但 总 归 


写 清楚 了 。 





























上 了 两 种 语言 混合 在 类 型 系统 和 编码 惯例 上 的 冲突 。 
把 Rust 代码 使 用 tibgit2 的 过 程 都 





然后 ， 下 一 市 会 构建 访问 Libgit2 的 安全 接口 。 届 时 将 让 Rust 类 型 来 强制 落实 Libgit2 对 
用 户 给 出 的 规则 。 好 在 Libgit2 是 设计 精良 的 C 库 ， 因 此 Rust 的 安全 性 迫使 我 们 提出 的 问 
题 都 有 很 好 的 答案 ， 从 而 可 以 构建 没有 unsafe 函数 的 符合 Rust 惯例 的 接口 。 
本 节 要 写 的 程序 非常 简单 : 通过 命令 行 参数 接收 一 个 路 径 ， 打 开 对 应 的 Git 仓库 ， 把 最 近 
一 次 提交 的 信息 打印 出 来 。 但 这 对 于 演示 如 何 构建 安全 和 符合 Rust 惯例 的 接口 来 说 已 经 足 


够 了 。 


在 这 个 原始 接口 中 ， 程 序 最 终 用 到 的 Libgit2 中 的 函数 和 类 型 比 之 前 要 多 很 多 。 因 

















此 有 必 


要 把 extern 块 转移 到 一 个 独立 的 模块 中 。 为 此 要 在 git-toy/src 中 创建 一 个 名 为 raw.rs 的 文 











件 ， 其 内容 如 下 





#![allow(non_camel_case_types)] 
use std::os::raw::{c_int, c_char, c_uchar}; 


#[link(name = "git2")] 


extern { 
pub fn 
pub fn 
pub fn 
pub fn 
pub fn 


pub fn 


pub fn 


git_Libgit2_init() -> c_int; 
git_Libgit2_shutdown() -> c_int; 
giterr_last() -> *const git error; 


git_repository_open(out: *mut *mut git_ repository, 
path: *const C_char) -> c_int; 
git_repository_free(repo: *mut git_ repository); 


git_reference name to id(out: *mut git _oid, 
repo: *mut git_repository, 
reference: *const c_char) -> c_int; 


git_ commit lookup(out: *mut *mut git commit, 
repo: *mut git_repository, 
id: *const git oid) -> c_int; 
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pub fn git commit author(commit: *const git commit) -> *const git signature; 
pub fn git commit message(commit: *const git commit) -> *const c_char; 


pub fn git commit free(commit: *mut git commit); 


} 


pub enum git_repository {} 
pub enum git_commit {} 


#[repr(C)] 
pub struct git error { 


pub message: *const C_char， 


pub klass: c_int 


} 


#[repr(C)] 
pub struct git oid { 

pub id: [c_uchar; 20] 
} 


pub type git time t = i64; 


#[repr(C)] 

pub struct git time { 
pub time: git_time 七 ， 
pub offset: c_int 


} 


#[repr(C)] 
pub struct git_signature { 
pub name: *const c_char, 


pub email: *const c_char, 


pub when: git_time 


上 


这 里 每 一 项 都 照搬 了 Libgit2 自己 的 头 文件 。 例 如 ，libgit2-0.25.1/include/git2/repository.h 





包含 如 下 声明 : 


extern int git repository _ open(git repository **out, const char *path); 


这 个 函数 尝试 打开 路 径 为 path 的 Git 仓库 。 如 果 一 切 顺利 ， 





它 会 创建 一 个 git_repository 


对 象 ， 并 在 out 指向 的 位 置 存储 一 个 指向 它 的 指针 。 等 价 的 Rust 声明 如 下 : 


pub fn git_repository_open(out: xmut *mut git_repository， 
path: *const C_char) -> c_int; 





libgit2 的 公有 头 文件 将 git_repository 定义 为 一 个 不 


typedef struct git repository git_repository; 


为 这 个 类 型 的 细节 是 库 私 有 的 ， 所 以 公有 头 文件 不 会 定义 struct git_repository， 以 确 
保 这 个 库 的 用 户 永远 不 会 自己 构建 该 类 型 的 实例 。Rust 中 与 不 完整 结构 体 类 型 对 应 的 定义 





六 











可 以 这 样 : 


pub enum git_repository {} 


构 体 类 型 的 typedef: 





这 是 一 个 没有 变 体 的 枚 举 类 型 。 在 Rust 中 无 法 创建 这 样 一 个 类 型 的 值 。 这 是 一 个 “怪物 ”， 
但 它 完美 映射 了 只 有 tibgit2 才 可 能 构建 的 一 种 C 类 型 并且 只 能 通过 原始 指针 来 操作 。 
手工 写 一 个 大 extern 块 是 很 麻烦 的 。 如 果 你 正在 创建 一 个 复杂 C 库 的 Rust 接口 ， 可 以 试 
一 试 bindgen 包 。 这 个 包 中 的 函数 可 以 用 在 构建 脚本 中 解析 C 头 文件 ， 并 自动 生成 对 应 的 
Rust 声明 。 因 为 篇 幅 有 限 ， 这 里 就 不 展示 如 何 使 用 bindgen 了 ,但 它 在 crates.io 的 页 面 上 
有 相关 文档 的 链接 。 


接 下 来 要 完全 重 写 main.rs。 首 先 ， 需 要 声明 raw 模块 : 


mod raw; 


根据 tibgit2 的 约定 ， 不 可 靠 的 函数 会 返回 整数 ， 正 值 或 0 表示 成 功 ， 负 值 表示 失败 。 如 
果 发 生 错 误 ，giterr_last 函数 会 返回 一 个 指向 git_error 结构 体 的 指针 ， 提 供 关 于 错误 的 
更 详细 信息 。libgit2 拥有 这 个 结构 体 ， 因 此 我 们 不 需要 自己 释放 它 ， 不 过 它 可 能 会 被 下 
一 次 库 调用 覆盖 。 真 正 的 Rust 接口 会 使 用 Resutt， 但 在 这 个 原始 版 中 ， 我 们 想 原封 不 动 
地 使 用 Libgit2 函数 ， 因 此 必须 自己 写 函 数 来 处 理 错 误 : 


use std::ffi::CStr; 
use std::0s::raw::c_int; 






























































fn check(activity: &'static str, status: c_int) -> c_int { 
if status < 0 { 
unsafe { 

Let error = &*raw::giterr_last(); 

println!("error while {}: {} ({})", 
activity, 
CStr::from_ptr(error.message).to_string_Lossy() ， 
error.klass); 

std: :process: :exit(1); 


status 


我 们 会 使 用 这 个 函数 检查 libgit2 调用 的 结果 ， 如 下 所 示 : 


check("initializing library", raw::git libgit2 init()); 





这 里 又 使 用 了 前 面 使 用 过 的 CStr 方法 : from_ptr 用 于 从 C 字符 串 构 建 CStr，to_string_ 
Lossy 用 于 将 其 转换 为 Rust 可 以 打印 的 值 。 


接 下 来 需要 一 个 函数 打印 提交 消息 : 


unsafe fn show_commit(commit: *const raw::git commit) { 
Let author = raw::git commit_ author(commit); 














Let name = CStr::from ptr((*author).name).to_string_lossy(); 
let email = CStr::from ptr((*author).email).to_string_lossy(); 
println!("{} <{}>\n", name, email); 


let message = raw::git commit message(commit); 
println!("{}", CStr::from_ptr(message).to_string_lossy()); 
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拿 到 指向 git_commit 的 指针 后 ，show_commit 调用 git_commit_author 和 git_commit_message 
取得 所 需 的 信息 。 这 两 个 国 数 遵循 Libgit2 文档 中 给 出 的 约定 : 


如 果 函 数 的 返回 值 是 一 个 对 象 ， 那 这 个 函数 就 是 一 个 获取 函数 ， 而 该 对 象 的 生命 
期 附属 于 父 对 象 。 


用 Rust 的 话说 ，author 和 message 都 是 从 commit 借用 的 ， 也 就 是 说 ，show_commit 不 需要 





自己 释放 它们 。 但 是 ， 它 也 不 能 在 commit 被 释放 以 后 还 持 有 它们 。 因 为 这 个 API 使 用 原 





始 指针 ， 所 以 Rust 不 会 为 我 们 检查 它们 的 生命 期 。 如 果真 的 意外 创建 了 甚 空 指针 ， 那 念 怕 
要 到 程序 月 潢 时 才 会 发 现 。 





二 


前 面 的 代码 假设 这 些 字段 保存 UTF-8 文本 ， 但 这 并 不 总 是 对 的 。Git 也 允许 其 他 编码 。 正 


确 解释 这 些 字 符 串 可 能 需要 使 用 encoding 包 。 为 简单 起 见 ， 就 先 不 考虑 这 些 问 题 了 。 
我 们 程序 的 main 函数 如 下 : 











use std::ffi::CString; 
use std::menm; 
use std::ptr; 
use std::os::raw::C_char; 
fn main() { 
let path = std::env::args().skip(1).next() 
.expect("usage: git-toy PATH"); 
let path = CString::new(path) 
.expect("path contains null characters"); 
unsafe { 


check("initializing library", raw::git libgit2 init()); 
Let mut repo = ptr::null_ mut(); 
check("opening repository", 
raw::git_repository_open(&mut repo, path.as_ptr())); 
let c_name = b"HEADN\0" .as_ptr() as *const c_char; 
Let mut oid = mem: :uninitialized(); 
check("looking up HEAD", 
raw::git_reference_name to _id(&mut oid, repo, c_name)); 
Let mut commit = ptr::null_mut(); 
check("looking up commit", 
raw::git _ commit lookup(&mut commit, repo, &oid)); 
show_commit(commit); 
raw::git commit free(commit); 


raw::git_repository_free(repo); 


check("shutting down library", raw::git libgit2_ shutdown()); 








代码 首先 处 理 路 径 参 数 并 初始 化 库 ， 这 些 前 面 都 见 过 。 第 一 段 新 代 码 是 这 样 的 : 


Let mut repo = ptr::nuLL mut(); 
check("opening repository", 
raw::git_repository_open(&mut repo, path.as_ptr())); 


调用 git_repository_open 会 尝试 打开 给 定 路 径 的 Git 仓库 。 如 果 成 功 ， 则 会 为 它 分 配 一 
个 新 的 git_repository 对 象 ， 并 设置 让 repo 指向 它 。Rust 隐 式 地 将 引用 转换 为 原始 指针 ， 
因此 这 里 传 入 &mut repo 提供 了 调用 所 需 的 *mut *mut git_repository。 


这 展示 了 用 到 的 另 一 个 Libgit2 约定 。 同 样 ， 摘 自 Libgit2 文档 : 

通过 第 一 个 参数 以 指针 对 指针 形式 返回 的 对 象 由 调用 者 所 有 ， 并 负责 释放 它们 。 
用 Rust 的 话说 ， 就 是 国 数 git_repository_open 会 把 新 值 的 所 有 权 传 给 调用 者 。 
接 下 来 ， 再 看 看 查找 仓库 最 新 提交 对 象 散 列 的 代码 : 


let mut oid = mem::uninitialized(); 
check("looking up HEAD", 
raw: :git_reference name to _ id(&mut oid, repo, c_name)); 


git_oid 类 型 存储 一 个 对 象 标识 符 ， 这 是 Git 在 内 部 (及 令 人 愉快 的 用 户 界面 中 ) 使 用 的 
一 个 160 位 的 散 列 码 ， 用 于 标识 提交 和 文件 的 各 个 版 本 等 。 这 里 调用 git_reference_name_ 
to_id 查找 的 是 当前 "HEAD" 提交 的 对 象 标识 符 。 


在 C 中 ,通过 把 指针 传 给 函数 并 由 函数 来 初始 化 变量 是 很 常见 的 。git_reference_name_ 
to_id 函数 在 这 里 就 是 将 它 的 第 一 个 参数 当 作 一 个 要 初始 化 的 变量 。 但 Rust 不 允许 借用 一 
个 未 初始 化 变量 的 引用 。 可 以 用 0 来 初始 化 oid， 但 这 是 一 种 浪费 ， 因 为 这 时 候 存 储 的 任 
何 值 都 会 被 覆盖 。 


把 oid 初始 化 为 uninitialized() 可 以 解决 这 个 问题 。 这 里 的 std: :mem: :uninitialized 国 
数 返 回 了 一 个 你 想 要 的 任意 类 型 的 值 ， 只 不 过 这 个 值 包含 的 都 是 未 初始 化 的 位 ， 并 且 也 没 
有 机 器 码 实际 用 于 生成 这 个 值 。 不 过 ，Rust 在 这 里 会 认为 oid 已 经 被 赋予 了 某 种 值 ， 因 此 
允许 我 们 借用 对 它 的 引用 。 可 以 想象 ， 从 一 般 意 义 上 说 ， 这 是 非常 不 安全 的 。 读 取 未 初始 
化 的 值 是 未 定义 行为 ， 如 果 这 个 值 的 某 部 分 实现 了 Drop， 那 即使 清除 它 也 是 未 定义 行为 。 
只 能 做 一 些 安全 的 事情 。 

通过 std::ptr::write 徐 盖 它 ， 因 为 std: :ptr::write 要 求 目标 是 未 初始 化 的 。 
。 把 它 传 给 std: :mem: :forget， 因 为 std: :mem: :forget 会 取得 其 第 一 个 参数 的 所 有 权 ， 并 
且 不 清除 它 就 能 让 它 消 失 (对 初始 化 的 值 这 么 做 会 导致 内 存 泄漏 )。 
。 把 它 传 给 一 个 可 以 初始 化 它 的 外 来 函数 ， 比 如 git_reference_name_to_id。 
如 果 调 用 成 功 ，oid 就 变 成 真正 初始 化 了 ， 一 切 正常 。 如 果 调 用 失败 ， 那 么 函数 不 会 使 用 
oid， 其 类 型 并 不 需要 被 清除 ， 因 此 代码 在 这 种 情况 下 也 安全 。 


对 repo 和 commit 变量 也 可 以 应 用 uninitialized,， 但 由 于 它们 只 有 一 个 字 长 ， 而 且 
uninitialized 使 用 起 来 有 危险 ， 因 此 干脆 直接 把 它们 初始 化 为 空 : 
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let mut commit = ptr: 


:nuULL_mut() ; 


check("looking Up commit", 
raw::git commit lookup(&mut commit, repo, &oid)); 


这 样 会 取得 提交 对 象 的 标识 符 并 查找 实际 的 提交 ， 成 功 后 会 将 一 个 git_commit 指针 保存 在 


commit 中 。 





main 函数 剩 下 的 代码 就 都 一 目 了 然 了 。 它 调用 前 面 定义 的 show_commit 国 数 ， 释 放 提交 和 


仓库 对 象 ， 最 后 关闭 库 。 





现在 可 以 拿手 头 任何 一 个 现成 的 Git 仓库 来 试 一 下 程序 : 


$ cargo run /home/jimb/rbattle 
Finished dev [unoptimized + debuginfo] target(s) in 0.0 secs 
Running “target/debug/git-toy /home/jimb/rbattle. 

Jim Blandy <jimb@red-bean.com> 


Animate goop a bit. 


$ 





21.8.5 ”libgit2 的 安全 接口 





libgit2 的 原始 接口 完美 展示 了 一 种 不 安全 特性 : 尽管 可 以 正确 使 用 (正如 前 面 所 做 的 )， 


但 Rust 不 能 强制 你 必须 遵 





守 规 则 。 给 这 样 一 个 库 设计 安全 API 涉及 找到 所 有 规则 ， 然 后 


想 办 法 将 违反 这 些 规则 的 操作 都 用 一 种 类 型 或 借用 检查 错误 来 表示 。 


下 面 就 是 程序 用 到 的 tibgi 


t2 特性 的 规则 。 


在 使 用 任何 库 函 数 之 前 必须 调用 git_Libgit2_init。 在 调用 git_Libgit2_shutdown 之 后 ， 





不 能 使 用 任何 库 函 数 。 








。 除 输 出 参数 ， 传 给 Libgit2 函数 的 所 有 值 都 必须 完全 初始 化 。 

。 调用 失败 时 ， 传 入 的 要 保存 调用 结果 的 输出 参数 保持 未 初始 化 ， 不 能 使 用 它们 的 值 。 

。 git_commit 对 象 会 引用 派生 它 的 git_repository 对 象 ， 因 此 前 者 的 生命 期 不 能 超过 后 
者 。(Libgitz2 文档 并 未 载 明 这 些 ， 这 是 由 接口 中 某 些 函 数 的 存在 推断 出 并 通过 阅读 源 





码 验 证 的 。) 
。 类 似 地 ，git_signature 





























始终 借用 自给 定 的 git_commit， 因 此 前 者 的 生命 期 也 不 能 超过 








后 者 。( 文 档 里 确实 提 到 了 这 一 点 。) 
与 提交 关联 的 消息 以 及 作者 的 姓名 、 电 子 邮 箱 地 址 都 是 从 提交 借用 的 ， 在 提交 释放 后 不 











能 再 使 用 。 








。 libgit2 对 象 一 旦 被 释放 ， 就 不 能 再 使 用 。 
实际 上 ， 可 以 基于 Libgit2 构建 能 够 强制 执行 这 些 规则 的 Rust 接口 ， 要 么 通过 Rust 的 类 











型 系统 ， 要 么 通过 内 部 处 到 





细节 oo 





开始 之 前 ， 先 重新 规划 一 1 














整个 源 代码 树 的 结构 如 下 : 








项目 结构 。 我 们 希望 有 一 个 git 模块 暴露 这 个 安全 接口 ， 而 前 


面 程序 中 的 原始 接口 将 作为 它 的 私有 子 模块 。 
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git-toy/ 
上 一 Cargo.toml 
| 一 buildrs 





按照 8.2.1 节 讲 解 的 规则 ，9it 模块 的 源 代 码 放 在 git/mod.rs 中 ， 它 的 git: :raw 子 模块 的 源 
代码 则 放 在 git/raw.rs 中 。 
同样 ， 这 一 次 又 要 完全 重 写 main.rs。 第 一 行 代码 要 声明 git 模块 . 
mod git; 
然后 ， 需 要 创建 git 子 目 录 ， 把 raw.rs 移 过 去 : 


$ cd /home/jimb/git-toy 
$ mkdir src/git 
$ mv src/raw.rs src/git/raw.rs 


git 模块 需要 声明 自己 的 raw 子 模块 。 文 件 src/git/mod.rs 必须 标明 如 下 内 容 : 
mod raw; 
因为 它 不 是 pub， 所 以 这 个 子 模块 对 主 程序 不 可 见 。 


稍 后 需要 使 用 Libc 包 中 的 一 些 国 数 ， 因 此 必须 在 Cargo.toml 中 添加 依赖 项 。 完 整 的 文件 如 
下 所 示 : 











[package] 
name = "git-toy" 
version = "0.1.0" 


authors = ["Jim Blandy <jimb@red-bean.com>"] 
build = "build.rs" 


[dependencies] 
Vibe = "0352;23" 


对 应 的 extern crate 项 必须 出 现在 src/main.rs 中 : 


extern crate libc; 
它 需 要 使 用 此 错误 类 型 的 自己 的 结果 类 型 。 


模块 已 经 重新 安排 就 位 ， 接 下 来 看 错误 处 理 。 即 便 是 Libgit2 的 初始 化 函数 也 可 以 返回 
一 个 错误 码 ， 因 此 开始 之 前 需要 先 对 其 分 类 。 人 惯常 的 Rust 接口 需要 自己 的 Error 类 型 从 
giterr_last 捕获 Libgit2 的 失败 码 ， 以 及 错误 消息 和 分 类 。 适 当 的 错误 类 型 必须 实现 惯常 
的 Error、Debug 和 Display 特 型 。 然 后 ， 它 需要 自己 拥有 的 Result 类 型 使 用 这 个 Error 类 
型 。 下 面 是 src/git/mod.rs 中 必要 的 定义 : 

use std::error; 


use std::fmt; 
use std::result; 
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为 检查 调用 原始 库 的 结果 ， 模 块 需要 定义 一 个 把 返回 的 错误 码 转换 为 Result 的 函数 : 


这 个 check 函数 与 原始 接口 中 check 函数 的 主要 区 别 是 它 构 建 了 一 个 Error 值 ， 而 不 是 打 


#[derive(Debug)] 

pub struct Error { 
code: i32, 
message: String, 
class: i32 


} 


impl fmt::Display for Error { 


fn fmt(&self, f: &mut fmt::Formatter) -> result::Result<(), fmt::Error> { 


// 显示 Error 就 是 把 Libgit2 返 回 的 消息 显示 出 来 
self.message.fmt(f) 





} 


impl error::Error for Error { 
fn description(&self) -> &str { &self.message } 


} 


pub type Result<T> = result::Result<T, Error>; 























use std::os::raw::C_ int; 
use std: :ffiL::CStr; 


fn check(code: c_int) -> Result<c int> { 
if code >= 0 { 
return Ok(code); 


了 


unsafe { 
Let error = raw::giterr_last(); 


// Libgit2 保 证 (*error) ,message 始终 不 为 空 ， 而 且 以 空 字 节 结 尾 ， 


// 因此 这 个 调用 是 安全 的 

Let message = CStr::from ptr((*error).message) 
.to_string_lossy() 
.into_owned(); 





Err(Error { 
code: code as i32, 
message, 
class: (*error).klass as i32 


}) 
} 


印 错误 消息 后 立即 退出 。 


现在 可 以 开始 考虑 Libgit2 初始 化 了 。 这 个 安全 接口 会 提供 一 个 Repository 类 型 ,表示 打 
开 的 Git 仓库 ， 并 包含 可 以 解析 引用 、 查 找 提交 等 的 方法 。 下 面 是 Repository 在 git/mod.rs 








中 的 定义 : 
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/// 一 个 Git 仓 库 

pub struct Repository { 
// 这 必须 始终 是 一 个 指向 活 的 git_repository 结 构 体 的 指针 
// 其 他 Repository 都 不 能 再 指向 它 
raw: xmut raw::git_repository 

















} 


Repository 的 raw 字段 不 是 公有 的 。 因 为 只 有 这 个 模块 中 的 代码 可 以 访问 raw: :git_repository 
指针 。 要 让 模块 安全 ， 必 须 保证 这 个 指针 始终 能 够 得 到 正确 使 用 。 

如 果 创 建 Reposttory 的 唯一 方式 是 成 功 打开 一 个 新 Git 仓库 ， 那 就 可 以 确保 每 个 
Repository 都 指向 不 同 的 git_repository 对 象 。 


use std: :path::Path; 























impl Repository { 
pub fn open<P: AsRef<Path>>(path: P) -> Result<Repository> { 
ensure_initialized(); 


Let path = path to_cstring(path.as_ref())?; 
let mut repo = null_mut(); 
unsafe { 
check(raw: :git_repository_open(&mut repo, path.as_ptr()))?; 
} 
Ok(Repository { raw: repo }) 


} 


因为 要 使 用 这 个 安全 接口 必须 先 取得 一 个 Repository 值 ， 而 Repository: :open 一 上 来 就 调 
用 了 ensure_initialized， 所 以 可 以 确信 ensure_initialized 会 在 任何 Libgit2 函数 之 前 
被 调用 。 这 个 函数 的 定义 如 下 : 


use std; 
use libc; 














fn ensure_initialized() { 
static ONCE: std::sync::Once = std::sync::ONCE_INIT; 
ONCE.call_once(|| { 
unsafe { 
check(raw::git_ libgit2 init()) 
.expect("initializing libgit2 failed"); 
assert eq!(libc::atexit(shutdown), 0); 


}); 
} 


use std::io::Write; 


extern fn shutdown() { 


unsafe { 
if let Err(e) = check(raw::git libgit2 shutdown()) { 
Let _ = writeln!(std::io::stderr(), 
"shutting down libgit2 failed: {}", 
e); 
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std::process::abort(); 
} 
} 
} 


std: :sync::0nce 类 型 帮助 我 们 以 线程 安全 的 方式 来 运行 初始 化 代码 。 只 有 第 一 个 调用 
ONCE.call_once 的 线程 会 运行 给 定 的 闭 包 。 后 续 的 任何 调用 ， 无 论 通过 这 个 线程 还 是 其 他 
线程 ， 都 会 阻塞 到 第 一 个 调用 完成 ， 然 后 立即 返回 ， 不 会 再 次 运行 这 个 闭 包 。 闭 包 执 行 完 
毕 再 调用 ONCE.call_once 开销 很 低 ， 只 涉及 对 保存 在 ONCE 中 一 个 标志 位 的 一 次 原子 加 载 。 


在 前 面 的 代码 中 ， 初 始 化 闭 包 调 用 git_libgit2_init 并 检查 了 结果 。 它 偷 了 一 点 懒 ， 只 用 
expect 来 确保 初始 化 成 功 ， 而 没有 把 错误 传播 给 调用 者 。 


为 确保 程序 调用 git_libgit2_shutdown， 这 个 初始 化 闭 包 使 用 了 C 库 的 atexit 函数 。 这 个 
国 数 接收 一 个 在 退出 进程 前 要 调用 函数 的 指针 。Rust 朵 包 不 能 作为 C 函数 指针 来 用 ， 闭 包 
是 某 种 匿名 类 型 的 值 ， 包 含 它 捕 获 的 任何 变量 的 值 或 引用 。 而 C 函数 指针 只 是 一 个 指针 。 
不 过 ， 可 以 使 用 Rust 的 fn 类型， 只 要 把 它们 声明 为 extern 以 便 Rust 知道 使 用 C 调用 惯 
例 即 可 。 局 部 函数 shutdown 刚好 满足 要 求 ， 能 保证 libgit2 正常 关闭 。 

7.1.1 节 曾 提 到 过 跨 语 言 证 异 是 未 定义 行为 。atexit 调用 shutdown 就 越过 了 这 个 边界 ， 
此 关键 在 于 shutdown 不 要 许 异 。 这 也 是 shutdown 不 能 再 简单 地 使 用 expect 处 理 raw: :git_ 
Libgit2_shutdown 返回 错误 的 原因 。 此 时 ， 它 必须 上 报错 误 并 自己 终止 进程 。POSIX 禁止 
在 atexit 处 理 程 序 中 调用 exit， 因 此 shutdown 调用 std: :process::abort 硬性 终止 程序 。 


适当 地 提前 调用 git_libgit2_shutdown 是 有 可 能 的 ， 比 如 在 最 后 一 个 Repository 值 被 清除 
时 。 但 无 论 怎 么 调整 ， 调 用 git_libgit2_shutdown 都 必须 是 这 个 安全 API 的 责任 。 从 调用 
它 的 那 一 刻 起 ， 任 何 现存 的 Libgit2 对 象 都 会 变 得 不 能 安全 使 用 ， 因 此 安全 API 必须 不 直 
接 暴露 这 个 函数 。 

Repository 的 原始 指针 必须 始终 指向 一 个 活 的 git_repository 对 象 。 这 意味 着 关闭 一 个 仓 
库 的 唯一 方式 是 清除 拥有 该 对 象 的 Repository 值 : 

impl Drop for Repository { 
fn drop(&mut self) { 


unsafe { 
raw::git_repository_free(self.raw); 
































































































































} 
} 
} 
通过 只 在 指向 raw: :git_repository 的 唯一 指针 要 被 释放 时 调用 git_repository_free， 
Repository 类 型 也 保证 了 指针 在 释放 后 永远 不 会 再 被 使 用 。 
Repository: :open 方法 使 用 了 一 个 名 为 path_to_cstring 的 私有 方法 ， 该 方法 有 两 个 定义 : 
一 个 针对 类 Unix 系统 ， 一 个 针对 Windows: 


use std::ffi::CString; 




















#[cfg(unix)] 
fn path_to _cstring(path: &Path) -> Result<CString> { 
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// as_bytes 方 法 只 存在 于 类 Unix 系 统 中 


use std::0s::unix::ffi::0sStrExt; 





Ok(CString: :new(path.as_os_str().as_bytes())?) 
} 


#[cfg(windows)] 
fn path_to_cstring(path: &Path) -> Result<CString> { 
// 尝试 转换 到 UTF-8。 如 果 失 败 ， 则 Libgit2 也 不 能 处 理 这 个 路 径 
match path.to_str() { 
Some(s) => Ok(CString::new(s)?), 
None => { 
Let message = format!("CouLdn't convert path '{}' to UTF-8", 
path.display()); 





Err(message.into()) 


} 


这 个 Libgit2 接口 让 代码 变 得 有 点 环 手 。 在 所 有 平台 上 ，libgit2 都 接收 空 字 节 结尾 的 C 
字符 串 作为 路 径 。 在 Windows 上 ，Libgit2 假设 这 些 C 字符 串 包含 格式 正确 的 UTF-8 并 内 
部 将 它们 转换 为 Windows 实际 要 求 的 16 位 路 径 。 通 稼 情况 下 这 样 没 问题 ， 但 并 不 理想 。 
Windows 允许 文件 名 包含 格式 不 正确 的 Unicode， 因 此 就 不 能 转换 为 UTF-8。 如 果 遇 到 这 
样 的 文件 ， 不 可 能 把 它 的 名 字 传 给 Libgit2。 


在 Rust 中， 正确 的 文件 系统 路 径 是 一 个 std: :path: :Path。 这 个 类 型 经 过 精心 设计 ， 可 以 
处 理 Windows 或 POSIX 系统 中 的 任何 合法 路 径 。 这 意味 着 在 Windows 上 有 一 些 Path 值 不 
能 传 给 Libgit2， 因 为 它们 不 是 格式 正确 的 UTF-8。 因 此 尽管 path_to_cstring 的 行为 不 尽 
如 人 意 ， 但 已 经 是 基于 tibgit2 接口 所 能 给 出 的 最 好 方案 了 。 
刚刚 看 到 的 这 两 个 path_to_cstring 定义 依赖 我 们 的 Error 类 型 转换 ， 其 中 的 ? 操作 符 尝 
试 进行 这 种 转换 ，Windows 版 则 显 式 地 调用 .into()。 这 些 转换 没什么 可 说 的 : 

impl From<String> for Error { 


fn from(message: String) -> Error { 
Error { code: -1, message, class: 0 } 

















} 
} 


// NulError 是 CString: :new 在 字符 串 包含 府 入 的 空 字 节 时 返回 的 错误 
impl From<std: :ffi::NULError> for Error { 
fn from(e: std::ffi::NulError) -> Error { 
Error { code: -1, message: e.to_string(), class: 0 } 





} 
} 


接 下 来 要 想 办 法 把 Git 引用 解析 为 一 个 对 象 标识 符 。 因 为 对 象 标识 符 不 过 就 是 20 字 市 的 
散 列 值 ， 所 以 在 安全 API 中 暴露 出 来 完全 设 问 题 : 


/// 标识 符 ， 代 表 保 存在 Git 对 象 数据 库 中 的 某 种 对 象 ， 
/// 比如 提交 、 树 、 大 文件 、 标 签 ， 等 等 。 是 对 象 
/// 内 容 的 长 散 列 

pub struct Oid { 
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pub raw: raw::git_oid 


} 
我 们 要 给 Repository 添加 一 个 方法 来 执行 查找 : 


use std::mem::uninitialized; 
use std::os::raw::C_char; 


impl Repository { 
pub fn reference name to id(&self, name: &str) -> Result<0id> { 
let name = CString::new(name)?; 
unsafe { 
let mut oid = uninitialized(); 
check(raw::git_reference name_ to _id(&mut oid, self.raw, 
name.as_ptr() as *const c_char))?; 
Ok(Oid { raw: oid }) 


} 
尽管 oid 在 查找 失败 时 会 保持 未 初始 化 ， 这 个 函数 也 可 以 保证 调用 者 永远 看 不 到 这 个 未 初 
始 化 的 值 。 很 简单 ， 它 只 是 遵循 了 Rust 的 Result 惯例 : 调用 者 得 到 的 要 么 是 一 个 Ok， 要 
么 是 一 个 Err， 其 中 前 者 包含 已 经 适当 初始 化 的 0id 值 。 
接 下 来 ， 模 块 需要 一 种 从 仓库 中 取得 提交 的 方式 。 下 面 是 我 们 定义 的 Commit 类 型 : 


use std::marker::PhantomData; 




















pub struct Commit<'repo> { 
// 必须 始终 是 一 个 指向 可 用 git_commit 结 构 体 的 指针 
raw: xmut raw::git _ commit, 
_marker: PhantomData<&'repo Repository> 


} 


如 前 所 述 ，git_commit 对 象 的 生命 期 不 能 超过 从 中 取得 它 的 git_repository 对 象 。Rust 的 
生命 期 让 代码 精确 地 表达 了 这 个 规则 。 


在 本 章 前 面 RefwithFlag 的 例子 中 ， 我 们 曾 使 用 PhantomData 字段 告诉 Rust 视 同一 个 类 型 
包含 给 定 生命 期 的 革 个 引用 ， 而 实际 上 该 类 型 明显 不 包含 这 个 引用 。Commit 类 型 也 需要 做 
类 似 处 理 。 这 里 ，_marker 字段 的 类 型 是 PhantomData<&'repo Repository>， 表 明 Rust 应 该 
将 Commit<'repo> 当成 就 好 像 它 包含 生命 期 为 "repo 的 某 个 Repository 的 引用 。 


查找 提交 的 方法 如 下 所 示 : 
use std::ptr::nuLL_mut; 


impl Repository { 
pub fn find_commit(&self, oid: &0id) -> Result<Commit> { 
Let mut commit = Null_mut(); 
unsafe { 
check(raw::git commit lookup(&mut commit, self.raw, &oid.raw))?; 


} 


Ok(Commit { raw: commit, marker: PhantomData }) 





这 里 是 如 何 把 Commit 的 生命 期 关联 到 Repository 的 ? 按照 5.2.7 节 介 绍 过 的 规则 ，find_ 
commit 方法 的 签名 省 略 了 相关 引用 的 生命 期 。 如 果 把 生命 期 写 出 来 ， 完 整 的 签名 应 该 如 下 
所 示 : 


fn find_commit<'repo， 'id>(&'repo self, oid: &'id 0id) 
-> Result<Commit<'repo>> 


这 正 是 我 们 想 要 的 : Rust 视 同 返回 的 Commit 借用 了 seLf， 也 就 是 Repository。 
当 Commit 被 清除 时 ， 它 必须 释放 自己 引用 的 raw: :gtt_commit : 


impl<'repo> Drop for Commit<'repo> { 
fn drop(&mut self) { 
unsafe { 
raw::git commit free(self.raw); 

















} 
} 
可 以 从 Commit 借用 一 个 Signature (姓名 、 电 子 邮 箱 地 址 ) 和 提交 消息 的 文本 : 


impl<'repo> Commit<'repo> { 
pub fn author(&self) -> Signature { 
unsafe { 
Signature { 
raw: raw::git commit_ author(self.raw), 
_marker: PhantomData 














} 


pub fn message(&self) -> Option<&str> { 
unsafe { 
Let message = raw::git commit message(self.raw); 
char_ptr_to_str(self, message) 


} 
Signature 类 型 的 定义 如 下 : 


pub struct Signature<'text> { 
raw: *const raw::git_ signature, 
_marker: PhantomData<&'text str> 


} 


git_signature 对 象 总 会 从 别 的 地 方 借用 自己 的 文本 。 特 别 地 ，git_commit_author 返 
回 的 签名 从 git_commit 借用 自己 的 文本 。 因 此 我 们 的 安全 的 Signature 类 型 包含 一 个 
PhantomData<&'text str>， 以 告诉 Rust 视 同 该 类 型 包含 一 个 生命 期 为 'text 的 &str。 跟 以 
前 一 样 ， 什 么 也 不 用 多 写 ，Commit: :author 就 可 以 正确 地 将 它 返 回 的 Signature 的 'text 
生命 期 与 Commit 的 生命 期 关联 起 来 。 而 Commit: :message 方法 对 0ption<&str> 包含 的 提交 
消息 也 进行 了 同样 的 关联 。 

Signature 包含 取得 作者 姓名 和 电子 邮箱 地 址 的 方法 : 
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impL< 'text> Signature< text> { 


/// 将 作者 姓名 返回 为 &str， 或 者 如 果 不 是 格式 正确 的 UTF-8 则 返回 None 











pub fn name(&self) -> Option<&str> { 
unsafe { 
char_ptr_to_str(self, (*self.raw).name) 
} 
} 


/// 将 作者 的 电子 邮箱 地 址 返回 为 &str， 或 者 如 果 不 是 格式 正确 的 UTF-8 
pub fn email(&self) -> Option<&str> { 
unsafe { 
char_ptr_to_str(self, (*self.raw).email) 








3 
} 
} 


前 面 这 些 方法 都 依赖 一 个 私有 辅助 函数 char_ptr_to_str: 





则 返回 None 





/// 尝试 从 ptr 借 用 一 个 &str，ptr 可 能 为 空 ， 也 可 能 引用 格式 不 正确 的 UTF-8 


/// 给 这 个 结果 一 个 生命 期 ， 就 好 像 它 是 从 _owner 借 用 的 一 样 
7 


/// 安全 : 如 果 ptr 不 为 空 ， 它 一 定 指向 一 个 空 字 节 结尾 的 可 以 安全 访问 的 (字符 串 
unsafe fn char_ptr_to_str<T>(_owner: &T, ptr: *const c char) -> Option<&str> { 


if ptr.is null() { 
return None; 
} elsef 
CStr::from ptr(ptr).to_str().ok() 
} 
} 


这 里 永远 不 会 用 到 _owner 参数 的 值 ， 但 会 用 到 它 的 生命 期 。 把 这 个 函数 签 


fn char_ptr_to_str<'o, T: 'o>(_owner: &'o T, ptr: *const c_char) 
-> Option<&'o str> 


名 中 的 生命 期 写 


CStr::from_ptr 半数 返回 一 个 &CStr， 其 生命 期 完全 不 受 限制 ， 因 为 它 是 从 一 个 解 引 用 的 





原始 指针 借用 来 的 。 不 受 限制 的 生命 期 几乎 总 是 不 确切 的 ， 因 此 应 该 尽 : 
制 。 包 含 owner 参数 导致 Rust 将 它 的 生命 期 作为 返回 值 类 型 的 生命 期 ， 
接收 到 一 个 有 更 确切 限制 的 引用 。 








快 给 它们 添加 限 
因此 调用 者 可 以 





根据 Libgit2 的 文档 无 法 确定 git_signature 的 email 和 author 指针 是 否 可 以 为 空 ， 这 多 


少 让 人 对 Libgit2 还 不 错 的 文档 有 些 失 望 。 我 们 在 源 代码 中 四 处 翻 查 了 一 





段 时 间 ， 最 终 也 


没有 找到 让 自己 信服 的 证 据 。 因 此 决定 为 防 万 一 ， 最 好 让 char_ptr_to_str 做 好 面 对 空 指 








针 的 准备 。 在 Rust 中 ， 这 类 问题 马上 就 能 通过 类 型 来 回答 : 如 有 果 它 是 &s 
为 一 定 有 字符 串 ， 如 果 它 是 option<&str>， 那 就 是 可 选 的 。 











tr， 那 你 可 以 认 


最 终 ， 我 们 为 需要 的 所 有 功能 都 提供 了 安全 接口 。 而 位 于 sre/main.rs 中 的 新 main 函数 也 明 
显 


“苗条 了 ”许多 ， 看 起 来 像 真正 的 Rust 代码 了 : 


fn main() { 
let path = std::env::args_os().skip(1).next() 
.expect("usage: git-toy PATH"); 
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Let repo = git::Repository::open(&path) 
.expect("opening repository"); 


Let commit oid = repo.reference name_to_id("HEAD") 
.expect("looking up 'HEAD' reference"); 


Let commit = repo.find_ commit(&commit oid) 
.expect("looking up commit"); 


let author = commit.author(); 

println!("{} <{}>\n", 
author .name().unwrap_or("(none)"), 
author .email().unwrap_or("none")); 


println!("{}", commit.message().unwrap_or("(none)")); 


} 


本 节 在 一 个 不 安全 API 之 上 构建 了 一 个 安全 API， 把 违反 前 者 协议 的 所 有 可 能 都 转化 为 了 
一 种 Rust 类 型 错误 。 最 终结 果 是 Rust 可 以 保证 你 使 用 的 接口 的 正确 性 。 在 很 大 程度 上 ， 
我 们 让 Rust 强制 执行 的 这 些 规则 实际 上 也 是 C 和 C++ 程序 员 最 终 会 强制 自己 遵守 的 那些 
规则 。Rust 之 所 以 给 人 比 C 和 C++ 更 严格 的 印象 ， 不 是 因为 这 些 规 则 有 多 么 匪夷所思 ， 
而 是 因为 这 种 强制 是 机 械 的 和 全 面 的 。 


21.9 ”小结 


Rust 并 不 是 一 门 简单 的 语言 。 它 的 目标 是 跨越 两 个 截然 不 同 的 世界 。 它 是 一 门 现代 编程 语 
言 ， 注 重 安全 ， 也 有 类 似 闲 包 和 友 代 器 这 样 的 便捷 特性 。 但 Rust 的 目标 是 让 你 掌控 运行 它 
的 机 器 的 原始 能 力 ， 而 且 运行 时 开销 最 低 。 

这 门 语 言 的 形象 就 是 由 这 些 目标 决定 的 。Rust 设法 架 起 一 座 桥梁 ， 以 跨越 不 安全 代码 的 瀣 
沟 。 它 的 借用 检查 器 和 零 开 销 抽象 ， 让 开发 者 尽 可 能 接近 机 器 硬件 同时 又 不 会 冒 未 定义 行 
为 的 风险 。 如 果 这 样 还 不 够 ， 或 是 如 果 你 想 利 用 已 有 的 C 代码 ， 那 不 安全 代码 随时 待命 。 
但 同样 ， 这 门 语言 并 非 只 管 提 供 这 些 不 安全 特性 ， 然 后 说 声 祝 你 好 运 就 完事 了 。 它 的 目标 
仍然 是 使 用 不 安全 特性 构建 安全 API， 也 就 是 我 们 基于 Libgit2 所 做 的 。 当 然 ， 还 有 Rust 
大 队 提供 的 Box、Vec、 其 他 集合 类 型 ， 以 及 通道 ， 等 等 。 标 准 库 中 满 满 的 安全 抽象 ， 在 后 
台 则 是 通过 某 些 不 安全 代码 实现 的 。 

象 Rust 这 样 一 门 拥有 奴 心 壮志 的 语言 ， 念 怕 注 定 不 会 是 一 套 简 单 的 工具 。Rust 安全 、 快 
速 、 并 发 ， 而 且 高 效 。 应 该 用 它 来 构建 大 规模 、 高 性 能 、 安 全 、 可 靠 的 系统 ， 以 充分 利用 
现 有 硬件 的 潜力 。 应 该 用 它 来 让 软件 变 得 更 好 。 
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作者 介绍 

吉姆 . 布 兰 迪 (Jim Blandy) 从 1981 年 开始 编程 ，1990 年 开始 编写 自由 软件 。 他 曾 是 
GNU Emacs 和 GNU Guile 以 及 GNU 调试 器 GDB 的 维护 者 。 吉 姆 是 Subversion 版 本 控制 
系统 最 初 的 设计 者 之 一 。 他 目前 在 Mozilla 开发 Firefox 的 Web 开发 者 工具 。 

贾 森 . 奥 伦 多 夫 (Jason Orendorff) 为 Mozilla 优化 C++ 代码， 是 Firefox 的 JavaScript 引 
掌 的 模块 所 有 者 。 他 是 美国 田纳西 州 那 什 维尔 开发 者 社区 的 活路 成 员 ， 并 会 不 定期 组 织 当 
地 的 技术 活动 。 


封面 介绍 

本 书 封面 上 的 动物 是 一 只 蒙 塔 十 角 〈(Montagu's crab，Xantho hydrophilus)。 这 只 和 蟹 看 起 来 
很 壮实 ， 狠 赤 有 70 毫米 帘 ， 给 人 感觉 既 结 实 又 坚固 。 角 过 的 周边 有 沟 槽 状 起 优 ， 呈 淡 黄 
或 红 褐 色 。 它 有 10 条 腿 (5 对 )， 前 面 一 对 大 腿 ( 效 ) 大 小 相同 ， 带 有 黑色 尖 爪 或 蟹 钳 ， 
后 面 是 3 对 粗壮 而 相对 短小 的 步 足 ， 最 后 一 对 腿 用 来 划 水 。 它 们 走路 和 划 水 都 是 侧 向 的 。 
蒙 塔 十 蟹 发 现 于 大 西洋 东北 部 和 地 中 海地 区 。 退 潮 时 ， 它 们 生活 在 礁石 或 巨石 下 方 。 如 果 
把 石头 抬 起 来 ， 它 们 会 攻击 性 地 举 起 炙 钳 并 张 开 ， 以 使 自己 看 起 来 更 大 。 

这 种 蟹 以 汪 类 、 腹 足 类 或 其 他 种 类 的 螃蟹 为 食 。 它 们 主要 在 夜间 活动 。 每 年 3~7 月 是 母 蟹 
产 卵 季 ， 幼 蟹 几 乎 整个 夏季 都 浮游 在 海上 。 

O’Reilly 图 书 封面 上 的 很 多 动物 是 濒危 生物 ， 它 们 对 这 个 世界 很 重要 。 要 了 解 如 何 保 护 它 


们 ， 请 访问 animals.oreilly.com。 











本 书 封面 图 片 取 自 JpDodYy Natural History。 
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Rust 程 序 设 计 


Rust 是 一 门 新 的 系统 编程 语言 ， 兼 具 C 和 C++ 的 高 性 能 和 底层 控制 能 力 ， “本 书 是 Rust 开 发 者 案头 必 不 可 
而 且 能 保证 内 存 安全 和 线程 安全 ， 是 系统 编程 发 展 史上 的 一 个 巨大 进 ” 人 少 的 新 书 。 它 能 教会 你 正确 的 
步 。 本 书 对 Rust 进 行 了 全 面 介 绍 ， 详 细 人 解释 了 这 门 语言 的 重要 概念 ， 并 ”学 习 方法 ,尤其 是 掌握 所 有 权 
提供 了 大 量 清晰 易 懂 的 示例 ， 逐 步 指 导读 者 用 Rust 编 写 出 既 安全 又 高 性 。 和 生命 期 的 概念 。 书 中 满 满 的 


能 的 程序 。 实战 示例 和 对 真实 问题 的 深度 
_ 思考 让 我 印象 深刻 。” 

本 书 由 两 位 具有 数 十 年 经 验 的 系统 程序 员 撰写 ， 他 们 不 仅 分 享 了 自己 对 a 

Rust 的 深刻 见解 ， 而 且 还 提供 了 一 些 建 议和 操作 实践 ， 对 Rust 开 发 者 和 GE 


系统 程序 员 十 分 有 帮助 。 


目 Rust 如 何在 内 存 中 表示 值 〈 辅 以 图 表 ) 
日 完整 解释 了 所 有 权 、 转 移 、 借 用 和 生命 其 


国 Cargo、rustdoc、 单 元 测试 ， 以 及 如 何在 Rust 公 共 包 仓库 上 发 布 
代码 


目 泛 型 代码 、 闭 包 、 集 合 和 和 迭代 器 等 高 级 特性 

目 Rust 中 的 并 发 : 线程 、 互 斥 量 、 通 道 和 原子 操作 
目 不 安全 代码 ， 以 及 如 何 保持 使 用 常规 代码 的 完整 性 
目 用 丰富 的 例子 展示 了 Rust 各 方面 特性 的 综合 运用 
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发 经 验 ， 目 前 在 为 Mozilla Firefox Web 浏 览 器 开发 JavaScript 引 擎 。 
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